EPUB с помощью OCR- и AI-алгоритмов. Позволяет удобно извлекать текст и структуру из сканов PDF, фильтруя заголовки, колонтитулы и другие лишние элементы. 📌 Основные особенности: 🔵Конвертация PDF в Markdown с сохранением структуры 🔵Конвертация PDF в EPUB с автоматическим построением глав и оглавления 🔵Поддержка отсканированных PDF и OCR-распознавания текста 🔵Анализ макета страниц (колонки, блоки, порядок чтения) 🔵Фильтрация колонтитулов, номеров страниц и лишних элементов 🔵Извлечение изображений, таблиц и формул 🔵Локальная работа без обязательного подключения к интернету 🔵Интеграция с LLM для интеллектуального анализа структуры документа ➡️Установка: pip install pdf-craft 📱 Репозиторий 💬 Онлайн-конвертер ➡️Справочник Программиста. Подписаться
📄 PDF Craft — это проект на Python для конвертации PDF-файлов, особенно отсканированных книг, в структурированные форматы вроде Markdown и
30 декабря 202530 дек 2025
24
~1 мин