Найти тему
PROtranslation.ru

Сервисы распознавания текста: вагон и маленькая тележка

OCR — optical character recognition (оптическое распознавание текста)
OCR — optical character recognition (оптическое распознавание текста)

Разделим условно конвертеры на онлайн и офлайн. Онлайн-сервисы, как правило, бесплатны (живут за счет рекламы), позволяют работать с объемными файлами. Иногда требуется регистрация, которая расширяет возможности (загрузка из архива или выгрузка в облако). Минус: нужен интернет. Жирный минус: попрощайтесь с конфиденциальностью.

Офлайн-программы надо покупать. Пробные версии ограничены по числу страниц. Большинство сервисов представлены в двух вариантах.

Ко всем программам есть претензии по качеству распознавания. Обязательно надо проверять и подчищать файл после конвертации.

ABBYY FineReader

Не могли пройти мимо. FineReader стал своего рода отраслевым стандартом.

Программа давно на рынке, устанавливается на компьютер, поэтому важный документ не будет гулять по сети (есть и облачный сервис, доступный по подписке).
Программа давно на рынке, устанавливается на компьютер, поэтому важный документ не будет гулять по сети (есть и облачный сервис, доступный по подписке).

Однако при стоимости в 120 евро к качеству полученного текста (особенно со сносками, таблицами) остаются вопросы, так что без дополнительной обработки не обойтись.

ОНЛАЙН OCR сервис (onlineocr.net)

Выдает текст из .pdf и графических файлов весом до 15 Мбайт. onlineocr.net принимает до 15 страниц в час без регистрации. Для бесплатного инструмента вполне приемлемый результат конвертации. НО: помните о конфиденциальности.

Недавно в нашей группе VK (присоединяйтесь) переводчики предложили и другие полезные ресурсы. Соберем все вместе.

А-ля onlineocr.net:

  • Сonvertio.co // Платно, free-версия ограничена десятком страниц.
  • newocr.com // он же Free Online OCR
  • img2txt.com
  • OCR Convert
  • Платное приложение в Smartcat: от 100 р. за 20 стр. до 1800 р. за 500 стр.

Конвертация + организация .pdf

  • CleverPDF // Не только распознает текст, но и разделяет, объединяет pdf-файлы, удаляет куски или меняет их местами. Пакет стоит 2990 рублей.
  • ILovePDF // Выполняет те же задачи. Главное назначение — организация pdf-файлов. Палочка-выручалочка при работе с договорами, счетами и прочими бумагами (несекретными). Регистрация не требуется. Настольная версия есть для Windows; для macOS — в разработке. Год использования стоит около 5 тыс. рублей. Немало — за CleverPDF надо платить только раз.
  • Smallpdf // Рекордсмен по стоимости годовой подписки, более 7 тыс. рублей. По функционалу — все то же самое.

Не менее полезные сервисы

  • Сalibre // Система для работы с электронными книгами. Необходимо загружать.
  • ABBYY Screenshot Reader // Создает скриншоты экрана, распознает сфотографированный текст на многих языках. Программка удобна, скачивается на компьютер. Разработчики дарят 15-дневный пробный период. Цена невысокая, разово требуется заплатить 9,99 евро. Яблочным владельцам советуем присмотреться к бесплатному «аналогу» Screen Shot, доступному в App Store.
  • Tiny Scanner или ABBYY FineReader Online // Мини-сканер на смартфоне — приложение, которое сохраняет фотографии в .pdf. Если нет рядом сканера, может здорово выручить. Первый сканер дешевле, зато второй интегрируется с основной программой для солидных людей.

А чем пользуетесь вы? Соблюдаете конфиденциальность?

Кстати, на курсе «Технический арсенал переводчика» начинающему переводчику простым языком подробно рассказывают о работе программ распознавания текста, а также многом другом.

Подписывайтесь на наш канал и читайте:

Технологии на службе переводчика: обзор CAT программ
Что такое память переводов, или как типичный переводчик общался с техподдержкой «кошки»

С подпиской рекламы не будет

Подключите Дзен Про за 159 ₽ в месяц