Добавить в корзинуПозвонить
Найти в Дзене
IT Start | Python

📄 PDF Craft — это проект на Python для конвертации PDF-файлов, особенно отсканированных книг, в структурированные форматы вроде Markdown и

EPUB с помощью OCR- и AI-алгоритмов. Позволяет удобно извлекать текст и структуру из сканов PDF, фильтруя заголовки, колонтитулы и другие лишние элементы. 📌 Основные особенности: 🔵Конвертация PDF в Markdown с сохранением структуры 🔵Конвертация PDF в EPUB с автоматическим построением глав и оглавления 🔵Поддержка отсканированных PDF и OCR-распознавания текста 🔵Анализ макета страниц (колонки, блоки, порядок чтения) 🔵Фильтрация колонтитулов, номеров страниц и лишних элементов 🔵Извлечение изображений, таблиц и формул 🔵Локальная работа без обязательного подключения к интернету 🔵Интеграция с LLM для интеллектуального анализа структуры документа ➡️Установка: pip install pdf-craft 📱 Репозиторий 💬 Онлайн-конвертер ➡️Справочник Программиста. Подписаться

📄 PDF Craft — это проект на Python для конвертации PDF-файлов, особенно отсканированных книг, в структурированные форматы вроде Markdown и EPUB с помощью OCR- и AI-алгоритмов.

Позволяет удобно извлекать текст и структуру из сканов PDF, фильтруя заголовки, колонтитулы и другие лишние элементы.

📌 Основные особенности:

🔵Конвертация PDF в Markdown с сохранением структуры

🔵Конвертация PDF в EPUB с автоматическим построением глав и оглавления

🔵Поддержка отсканированных PDF и OCR-распознавания текста

🔵Анализ макета страниц (колонки, блоки, порядок чтения)

🔵Фильтрация колонтитулов, номеров страниц и лишних элементов

🔵Извлечение изображений, таблиц и формул

🔵Локальная работа без обязательного подключения к интернету

🔵Интеграция с LLM для интеллектуального анализа структуры документа

➡️Установка: pip install pdf-craft

📱 Репозиторий

💬 Онлайн-конвертер

➡️Справочник Программиста. Подписаться