1 месяц назад
🧾 Python & PDF: делаем документы, а не головную боль
Когда слышишь "генерация PDF", в голове сразу: шрифты, форматирование, таблицы, картинки, подписи, и... головная боль. Но мы тут на Python, а не в Word'е с 2006 года. Встречай библиотеки ReportLab и FPDF — инструменты, с которыми PDF перестаёт быть монстром. Сегодня: pip install reportlab fpdf from reportlab.pdfgen import canvas # Создаём холст (лист PDF) c = canvas.Canvas("hello.pdf") # Пишем текст на координатах (x=100, y=750) c.drawString(100, 750, "Привет, PDF!") # Сохраняем PDF c.save() 💡 Комментарий: from reportlab...
139 читали · 1 год назад
Извлечение текста из PDF-файлов с помощью Python: исчерпывающее руководство
Источник: Nuances of Programming Введение В век больших языковых моделей (LLM) и их широкого применения  —  от простого обобщения и перевода текстов до прогнозирования курса акций на основе настроений и финансовых отчетов  —  важность текстовых данных как никогда велика. Существует множество типов документов, содержащих подобную неструктурированную информацию, от веб-статей и постов в блогах до рукописных писем и стихов. Однако значительная часть этих текстовых данных хранится и передается в формате PDF...