В данной статье мы рассмотрим работу с файлами PDF средствами Python. Мы изучим, основные инструменты: библиотеки и модули для работы с PDF файлами. Это статья начало серии статей, посвященных работе с PDF файлами средствами Python. В первой части, мы рассмотрим, основные Python библиотеки для работы с PDF файлами. Вторая часть будет посвящена работе с существующими файлами, чтение файлов, извлечение нужной информации, картинок из файла. Третья часть будет рассматривать вопросы создания PDF файлов...
Делимся тестом еще одной полезной нейронки. 📚 Умеет читать PDF до 32 мегабайт (это примерно 70 книг о Гарри Поттере). Рассматриваем на примере книги "Глубокое обучение" Джона Келлехера. И ставим сервису оценку 3 с плюсом: качество хромает, особенно, если вводить запросы на русском. Иногда сервис chatpdf может отрицать наличие определенных данных в файле, хотя они там определенно есть, а также путается в количестве страниц и разделов. В соответствующей ветке сообщества open.ai разработчик обещает допилить алгоритм в скором времени...