Добрый день. В этой статье расскажу как распознать текст из файлов PDF и сохранить его в формате word. Я перепробовал очень много онлайн конверторов pdf файлов в word, но многие из них оказывались или платными или не совсем корректно переводили русский текст или вовсе вставляли текст картинкой в файл Word. Только один из бесплатных онлайн конвертеров перевел текст из pdf в word без ошибок, но с некоторыми замечаниями. Этот онлайн конвертер сохранил весь текст в word, сохранил структурированную таблицу, но только неправильно был выбран шрифт, но это можно легко исправить...
Сразу оговорюсь, что я не рекламирую этот продукт за вознаграждение. Просто делюсь полезной на мой взгляд программой.
DocFetcher – это приложение с открытым исходным кодом, позволяющее вам совершать поиск по содержимому файлов на вашем компьютере. Приложение работает на Windows, Linux и OS X.
Не буду расписывать все прелести данной программы, всё это можно почитать, а также скачать программу тут.
Расскажу предысторию, зачем она мне понадобилась и как я обнаружил это чудо.
У меня на компе скопилось достаточное количество технической документации, литературы по электронике, даташитов и схем...