732 читали · 2 года назад
Python работа с файлами PDF
В данной статье мы рассмотрим работу с файлами PDF средствами Python. Мы изучим, основные инструменты: библиотеки и модули для работы с PDF файлами. Это статья начало серии статей, посвященных работе с PDF файлами средствами Python. В первой части, мы рассмотрим, основные Python библиотеки для работы с PDF файлами. Вторая часть будет посвящена работе с существующими файлами, чтение файлов, извлечение нужной информации, картинок из файла. Третья часть будет рассматривать вопросы создания PDF файлов...
477 читали · 1 год назад
РАСПОЗНАВАНИЕ текста в PDF-файлах с помощью Python
Привет, ребята! Возможно, вы слышали о распознавании текста с использованием Python. Самой известной библиотекой является tesseract, спонсируемая Google. Выполнить распознавание изображения очень просто. Проблема возникает, когда вы хотите выполнить распознавание текста поверх PDF-документа. Я работаю над проектом, в котором хочу вводить PDF-файлы, извлекать из них текст, а затем добавлять текст в базу данных. Мне пришлось много искать, прежде чем я наткнулся на окончательное решение. Итак, не теряя времени, давайте начнем...