Делюсь ссылками на сайты, где можно любой документ сделать «отсканированным», бесплатно распознать OCR (текст с отсканированного файла), перевести pdf в Excel и извлечь из pdf-файла шрифты.
Берем на заметку следующие ресурсы.
https://www.scanyourpdf.com/ - помогает создать «отсканированные» документы. Если нужно срочно придать документу вид только что отсканированного, просто загружаем файл, выбираем какая скан-версия должна быть: черно-белая или цветная, выбираем разрешение и все, отсканированный документ готов, можно использовать как нужно.
https://www.onlineocr.net/ - распознает отсканированный (pdf) и сфотографированный (jpeg, jpg) текст. Загружаем файл с текстом, следуем командам интерфейса, выгружаем текст в виде doc файла и берем в работу. Для бесплатного решения качество работы – отменное, работает быстро, распознает до 95% отсканированного или сфотографированного текста.
https://pdftables.com/ - переводит pdf в Excel. Если нужен текст из таблицы в pdf -файле в редактируемом