Алтай
Python чтение pdf файлов
В предыдущей статье "Python работа с файлами PDF" мы рассмотрели основные библиотеки для работы с PDF (чтения, извлечения данных и создания PDF файлов). В данной статье мы рассмотрим методы чтение и извлечение данных из файлов PDF средствами Python. Для извлечения данных из файла PDF используют следующие библиотеки: PyPDF2 Устанавливаем библиотеку через командную строку: pip install PyPDF2 Извлечение метаданных PDF: В метаданных содержатся сведения о количестве страниц, сведения об авторе, авторах, название приложения в котором создан файл, дата создания...
Работа с файлами Python. Статья 4 (бинарные файлы)
Мой канал о программировании Old Programmer, а здесь: Тематическое оглавление моего Zen-канала (Old Programmer). А тут много материалов по Python. Продолжаем разговор о бинарных файлах, начатый в прошлой статье. Бинарные файлы в языке Python Как мы уже видели, ничего сложного в бинарных файлах нет. Обмен с ними осуществляется через массив bytes. Для понимания обратимся к программе p500.py. Она выдает на консоль коды всех байтов файла. Обращаю внимание на следующие два момента: Разумеется можно читать не только по одному байту: f...