Как извлечь текст из фото, скриншота или скана PDF
Перевод изображения в текст делается через OCR: вы выделяете текст на фото/скриншоте или запускаете распознавание — и получаете редактируемый текст, который можно копировать, искать и вставлять в документы. Ниже — самые быстрые способы по устройствам и правила, которые резко повышают точность.
Если нужно «снять» пару строк — используйте встроенные функции телефона или распознавание по выделению на ПК. Онлайн‑OCR имеет смысл, когда вы не можете установить программы.
С телефона: iPhone и Android
iPhone/iPad (Live Text / “Сканер текста”)
- Откройте фото в «Фото» (или картинку в браузере/мессенджере).
- Нажмите и удерживайте текст, выделите фрагмент.
- Выберите Копировать (или Перевести, если нужно).
Android (Google Lens или аналог в “Фото/Камере”)
- Откройте фото в галерее или запустите Lens из приложения поиска/камеры.
- Переключитесь в режим Текст.
- Выделите нужное → Копировать / Поделиться.
Если текст не выделяется, обычно помогает: увеличить изображение, переснять при ярком свете без теней и бликов, а также обрезать лишний фон вокруг текста.
На компьютере: быстрое распознавание с экрана и из PDF
Windows: извлечь текст “с экрана”
- В PowerToys есть инструмент извлечения текста: вызываете горячей клавишей, выделяете область — текст сразу в буфере обмена. Это удобно, когда копирование в приложении запрещено или текст в видео/картинке.
PDF‑сканы: чем отличается “скан” от “поискового PDF”
- Сканированный PDF часто состоит из картинок. OCR добавляет текстовый слой, поэтому вы сможете искать слова, выделять и копировать текст.
- Для многостраничных документов удобнее “документные” сканеры/редакторы PDF с OCR: они лучше держат разметку (абзацы, переносы, иногда таблицы).
Если документ содержит персональные данные (паспорт, договор, медсправки), избегайте случайных онлайн‑сервисов: выбирайте локальное распознавание на устройстве или в настольной программе.
Как повысить точность OCR (и получить аккуратный текст)
- Снимайте ровно: камера параллельно листу, без “трапеции”.
- Свет важнее всего: меньше теней по краям, без бликов от лампы/окна.
- Резкость: лучше 2–3 дубля и выбрать самый чёткий.
- Кадрируйте правильно: не обрезайте буквы и строки, уберите лишний фон.
- Уточняйте язык OCR: русский/английский/несколько языков — это влияет на словари и символы.
- Проверьте “опасные пары”:
0/O,1/I/l, дефис/тире, точки в реквизитах. - Таблицы снимайте крупнее: мелкая сетка и перспектива чаще всего “ломают” столбцы.
Быстрый выбор способа
| Задача | Что выбрать | Результат |
|---|---|---|
| Скопировать 1–2 абзаца | Встроенное выделение текста на телефоне / распознавание с экрана на ПК | Быстро, без подготовки |
| Оцифровать документ из нескольких страниц | Сканер/приложение для документов с OCR | Лучше качество и структура |
| Сделать PDF “поисковым” | OCR для PDF (создание текстового слоя) | Поиск и копирование в скане |
Частые ошибки
- Фото сделано под углом: строки “уезжают”, появляются лишние переносы.
- Тени и блики закрывают части букв — OCR дорисовывает символы неверно.
- Не выбран язык распознавания (или выбран не тот) — растёт число ошибок.
- Пытаются распознать таблицу как обычный текст — потом сложно восстановить столбцы.
- Загружают конфиденциальные документы в первый попавшийся онлайн‑OCR.
FAQ
Почему OCR портит абзацы и переносы?
Потому что программа угадывает структуру страницы по картинке. Чем хуже геометрия/качество, тем больше “сломанной” разметки.
Можно ли распознать рукописный текст?
Иногда да, но точность заметно ниже, чем у печатного. Лучше переснять крупнее и быть готовым к ручной правке.
Как вытащить текст из таблицы, чтобы вставить в Excel?
Старайтесь распознавать в режиме таблицы (если он есть). Если нет — распознайте в текст, затем вставьте и вручную выровняйте столбцы или используйте импорт “из текста” с разделителями.
Что выбрать, если важна конфиденциальность?
Встроенное распознавание на устройстве или локальные инструменты на ПК. Онлайн‑сервисы используйте только для некритичных данных.