Без Acrobat, без онлайн-сервисов. Скачали, положили рядом с файлами, запустили — готово. PDF и DJVU — основные форматы электронных копий книг и журналов в интернете. Исторические издания, старые журналы, дореволюционные книги — всё это можно найти в Google Books и других архивах. Но скачанный файл часто оказывается просто набором картинок: текст не выделить, не скопировать, и главное — не найти через поиск. Я собираю такие материалы и индексирую их в Archivarius 3000 — это десктопный поисковик по личной библиотеке, который находит нужное мгновенно. Но работает он только с файлами где есть текстовый слой. Вот и вся причина. Обрабатывать каждый файл вручную в отдельной программе — та ещё рутина. Мой bat-файл делает всё сам: конвертирует DJVU в PDF и прогоняет через OCR. Кладёте рядом с файлами, запускаете, отвечаете на три вопроса — и идёте пить чай. Tesseract распознаёт текст только для тех языков, словари которых установлены. Для русского и дореформенного русского словари нужно скачать