Как извлечь текст из фото, скриншота или скана PDF

Перевод изображения в текст делается через OCR: вы выделяете текст на фото/скриншоте или запускаете распознавание — и получаете редактируемый текст, который можно копировать, искать и вставлять в документы. Ниже — самые быстрые способы по устройствам и правила, которые резко повышают точность.

Если нужно «снять» пару строк — используйте встроенные функции телефона или распознавание по выделению на ПК. Онлайн‑OCR имеет смысл, когда вы не можете установить программы.

С телефона: iPhone и Android

iPhone/iPad (Live Text / “Сканер текста”)

Откройте фото в «Фото» (или картинку в браузере/мессенджере).
Нажмите и удерживайте текст, выделите фрагмент.
Выберите Копировать (или Перевести, если нужно).

Android (Google Lens или аналог в “Фото/Камере”)

Откройте фото в галерее или запустите Lens из приложения поиска/камеры.
Переключитесь в режим Текст.
Выделите нужное → Копировать / Поделиться.

Если текст не выделяется, обычно помогает: увеличить изображение, переснять при ярком свете без теней и бликов, а также обрезать лишний фон вокруг текста.

На компьютере: быстрое распознавание с экрана и из PDF

Windows: извлечь текст “с экрана”

В PowerToys есть инструмент извлечения текста: вызываете горячей клавишей, выделяете область — текст сразу в буфере обмена. Это удобно, когда копирование в приложении запрещено или текст в видео/картинке.

PDF‑сканы: чем отличается “скан” от “поискового PDF”

Сканированный PDF часто состоит из картинок. OCR добавляет текстовый слой, поэтому вы сможете искать слова, выделять и копировать текст.
Для многостраничных документов удобнее “документные” сканеры/редакторы PDF с OCR: они лучше держат разметку (абзацы, переносы, иногда таблицы).

Если документ содержит персональные данные (паспорт, договор, медсправки), избегайте случайных онлайн‑сервисов: выбирайте локальное распознавание на устройстве или в настольной программе.

Как повысить точность OCR (и получить аккуратный текст)

Снимайте ровно: камера параллельно листу, без “трапеции”.
Свет важнее всего: меньше теней по краям, без бликов от лампы/окна.
Резкость: лучше 2–3 дубля и выбрать самый чёткий.
Кадрируйте правильно: не обрезайте буквы и строки, уберите лишний фон.
Уточняйте язык OCR: русский/английский/несколько языков — это влияет на словари и символы.
Проверьте “опасные пары”: 0/O, 1/I/l, дефис/тире, точки в реквизитах.
Таблицы снимайте крупнее: мелкая сетка и перспектива чаще всего “ломают” столбцы.

Быстрый выбор способа

Задача	Что выбрать	Результат
Скопировать 1–2 абзаца	Встроенное выделение текста на телефоне / распознавание с экрана на ПК	Быстро, без подготовки
Оцифровать документ из нескольких страниц	Сканер/приложение для документов с OCR	Лучше качество и структура
Сделать PDF “поисковым”	OCR для PDF (создание текстового слоя)	Поиск и копирование в скане

Частые ошибки

Фото сделано под углом: строки “уезжают”, появляются лишние переносы.
Тени и блики закрывают части букв — OCR дорисовывает символы неверно.
Не выбран язык распознавания (или выбран не тот) — растёт число ошибок.
Пытаются распознать таблицу как обычный текст — потом сложно восстановить столбцы.
Загружают конфиденциальные документы в первый попавшийся онлайн‑OCR.

FAQ

Почему OCR портит абзацы и переносы?
Потому что программа угадывает структуру страницы по картинке. Чем хуже геометрия/качество, тем больше “сломанной” разметки.

Можно ли распознать рукописный текст?
Иногда да, но точность заметно ниже, чем у печатного. Лучше переснять крупнее и быть готовым к ручной правке.

Как вытащить текст из таблицы, чтобы вставить в Excel?
Старайтесь распознавать в режиме таблицы (если он есть). Если нет — распознайте в текст, затем вставьте и вручную выровняйте столбцы или используйте импорт “из текста” с разделителями.

Что выбрать, если важна конфиденциальность?
Встроенное распознавание на устройстве или локальные инструменты на ПК. Онлайн‑сервисы используйте только для некритичных данных.