В данной статье мы рассмотрим работу с файлами PDF средствами Python. Мы изучим, основные инструменты: библиотеки и модули для работы с PDF файлами. Это статья начало серии статей, посвященных работе с PDF файлами средствами Python. В первой части, мы рассмотрим, основные Python библиотеки для работы с PDF файлами. Вторая часть будет посвящена работе с существующими файлами, чтение файлов, извлечение нужной информации, картинок из файла. Третья часть будет рассматривать вопросы создания PDF файлов. PyPDF2 PyPDF2 бесплатная библиотека с открытым исходным кодом. Библиотека предназначена для извлечения информации и содержимого из PDF документов, разделение, объединение, обрезка и преобразование страниц PDF файлов. Модуль позволяет добавлять пользовательские данные, параметры просмотра и пароли, а также может извлекать метаданные и изображения. PyPDF2 предназначен для работы с уже существующими PDF файлами, но данная библиотека не может создавать новые файлы. Установка библиотеки: pip i