🚀 img2table — это Python-библиотека для извлечения таблиц из изображений и PDF-файлов с последующим преобразованием их в структурированные данные (например, pandas DataFrame или Excel). 📌 Основные особенности: 🔵Извлечение таблиц из изображений (PNG, JPG и др.) 🔵Поддержка работы с PDF-документами 🔵Автоматическое обнаружение структуры таблиц (строки, столбцы и ячейки) 🔵Поддержка OCR для распознавания текста в таблицах 🔵Интеграция с Tesseract, EasyOCR, PaddleOCR, AWS Textract и Google Vision 🔵Преобразование таблиц в pandas.DataFrame 🔵Экспорт извлечённых таблиц в Excel 🔵Гибкая настройка параметров извлечения таблиц 🔵Быстрое извлечение таблиц с использованием алгоритмов компьютерного зрения ➡️Установка библиотеки: pip install img2table 📱 Репозиторий ➡️Справочник Программиста. Подписаться
🚀 img2table — это Python-библиотека для извлечения таблиц из изображений и PDF-файлов с последующим преобразованием их в структурированные
9 апреля9 апр
3
~1 мин