Как извлечь текст из фото, скриншота или скана PDF

Перевод изображения в текст делается через OCR: вы выделяете текст на фото/скриншоте или запускаете распознавание — и получаете редактируемый текст, который можно копировать, искать и вставлять в документы. Ниже — самые быстрые способы по устройствам и правила, которые резко повышают точность.

Если нужно «снять» пару строк — используйте встроенные функции телефона или распознавание по выделению на ПК. Онлайн‑OCR имеет смысл, когда вы не можете установить программы.

С телефона: iPhone и Android

iPhone/iPad (Live Text / “Сканер текста”)

  1. Откройте фото в «Фото» (или картинку в браузере/мессенджере).
  2. Нажмите и удерживайте текст, выделите фрагмент.
  3. Выберите Копировать (или Перевести, если нужно).

Android (Google Lens или аналог в “Фото/Камере”)

  1. Откройте фото в галерее или запустите Lens из приложения поиска/камеры.
  2. Переключитесь в режим Текст.
  3. Выделите нужное → Копировать / Поделиться.

Если текст не выделяется, обычно помогает: увеличить изображение, переснять при ярком свете без теней и бликов, а также обрезать лишний фон вокруг текста.

На компьютере: быстрое распознавание с экрана и из PDF

Windows: извлечь текст “с экрана”

  • В PowerToys есть инструмент извлечения текста: вызываете горячей клавишей, выделяете область — текст сразу в буфере обмена. Это удобно, когда копирование в приложении запрещено или текст в видео/картинке.

PDF‑сканы: чем отличается “скан” от “поискового PDF”

  • Сканированный PDF часто состоит из картинок. OCR добавляет текстовый слой, поэтому вы сможете искать слова, выделять и копировать текст.
  • Для многостраничных документов удобнее “документные” сканеры/редакторы PDF с OCR: они лучше держат разметку (абзацы, переносы, иногда таблицы).

Если документ содержит персональные данные (паспорт, договор, медсправки), избегайте случайных онлайн‑сервисов: выбирайте локальное распознавание на устройстве или в настольной программе.

Как повысить точность OCR (и получить аккуратный текст)

  1. Снимайте ровно: камера параллельно листу, без “трапеции”.
  2. Свет важнее всего: меньше теней по краям, без бликов от лампы/окна.
  3. Резкость: лучше 2–3 дубля и выбрать самый чёткий.
  4. Кадрируйте правильно: не обрезайте буквы и строки, уберите лишний фон.
  5. Уточняйте язык OCR: русский/английский/несколько языков — это влияет на словари и символы.
  6. Проверьте “опасные пары”: 0/O, 1/I/l, дефис/тире, точки в реквизитах.
  7. Таблицы снимайте крупнее: мелкая сетка и перспектива чаще всего “ломают” столбцы.

Быстрый выбор способа

ЗадачаЧто выбратьРезультат
Скопировать 1–2 абзацаВстроенное выделение текста на телефоне / распознавание с экрана на ПКБыстро, без подготовки
Оцифровать документ из нескольких страницСканер/приложение для документов с OCRЛучше качество и структура
Сделать PDF “поисковым”OCR для PDF (создание текстового слоя)Поиск и копирование в скане

Частые ошибки

  • Фото сделано под углом: строки “уезжают”, появляются лишние переносы.
  • Тени и блики закрывают части букв — OCR дорисовывает символы неверно.
  • Не выбран язык распознавания (или выбран не тот) — растёт число ошибок.
  • Пытаются распознать таблицу как обычный текст — потом сложно восстановить столбцы.
  • Загружают конфиденциальные документы в первый попавшийся онлайн‑OCR.

FAQ

Почему OCR портит абзацы и переносы?
Потому что программа угадывает структуру страницы по картинке. Чем хуже геометрия/качество, тем больше “сломанной” разметки.

Можно ли распознать рукописный текст?
Иногда да, но точность заметно ниже, чем у печатного. Лучше переснять крупнее и быть готовым к ручной правке.

Как вытащить текст из таблицы, чтобы вставить в Excel?
Старайтесь распознавать в режиме таблицы (если он есть). Если нет — распознайте в текст, затем вставьте и вручную выровняйте столбцы или используйте импорт “из текста” с разделителями.

Что выбрать, если важна конфиденциальность?
Встроенное распознавание на устройстве или локальные инструменты на ПК. Онлайн‑сервисы используйте только для некритичных данных.