Найти в Дзене
FixClan

Чем распознать текст из картинки?

Иногда очень требуется перепечатать текст с фотографии, либо другого изображения, в обычный файл, который можно открыть например, в Word и откорректировать. Делать это вручную сложно и отнимает много времени - гораздо проще доверить процесс специальным программам. Но какой из них стоит "скормить" наше фото, чтобы получить достойный результат?

Решил поэкспериментировать с бесплатным софтом и сервисами перевода графического формата документов в электронный. Для этого выбрал отсканированный разворот одного из старых журналов.

Разворот журнала
Разворот журнала

Первый испытуемый Freemore OCR не справился со своей задачей, хотя судя по выданному результату - очень старался. Возможно, программа не поняла какой язык текста используется на картинке, но такой настройки не нашел.

Онлайн-сервис FineReader
Онлайн-сервис FineReader

Следующим подопытным стал онлайн-сервис от популярного ABBYY FineReader. Правда, чтобы им воспользоваться нужно зарегистрироваться.

Результат распознавания от FineReader Online
Результат распознавания от FineReader Online

Честно признаться, не ожидал, что картинка "Заводу Экситон 50 лет" будет сохранена, как и текст со сносками. Хотя, зная FineReader, я был настроен на положительный результат. К сожалению, на новый аккаунт выдают бесплатно всего 10 сканирований и 5 в последующие месяцы. Всё, что свыше возможно купить за 129 евро/год, не более 5000 страниц.

Результат Cuneiform
Результат Cuneiform

Следующий бесплатный софт Cuneiform похоже и не старался с переносом текста. В ответ на картинку, он мне выдал только "ням".

FreeOCR решил со мной не разговаривать и "выпилился" сам
FreeOCR решил со мной не разговаривать и "выпилился" сам

В базовой "комплектации" FreeOCR отсутствует русский язык, из-за чего распознавание происходит безрезультатно, но в настройках есть возможность догрузить языковые пакеты, чем я занялся. Через 20 минут лазанья по github стало понятно о бесперспективности моих изысканий. Единственный файл, похожий на языковой пакет rus был найден в директории tessdata, но после скачивания и установки программа "выпилилась" с ошибкой, на что был положен огромный болт.

Сервис newocr.com
Сервис newocr.com

Последним опробован бесплатный сервис newocr.com, чей результат стал вторым после FineReader Online. Естественно, его потребуется привести в нормальный вид.

Если вам понравилась статья, то ставьте "палец вверх", делитесь в соц-сетях или ПОДПИСЫВАЙТЕСЬ - это лучший способ отблагодарить авторов. Спасибо :)