Добавить в корзинуПозвонить
Найти в Дзене
IT Start | Python

🚀 img2table — это Python-библиотека для извлечения таблиц из изображений и PDF-файлов с последующим преобразованием их в структурированные

🚀 img2table — это Python-библиотека для извлечения таблиц из изображений и PDF-файлов с последующим преобразованием их в структурированные данные (например, pandas DataFrame или Excel). 📌 Основные особенности: 🔵Извлечение таблиц из изображений (PNG, JPG и др.) 🔵Поддержка работы с PDF-документами 🔵Автоматическое обнаружение структуры таблиц (строки, столбцы и ячейки) 🔵Поддержка OCR для распознавания текста в таблицах 🔵Интеграция с Tesseract, EasyOCR, PaddleOCR, AWS Textract и Google Vision 🔵Преобразование таблиц в pandas.DataFrame 🔵Экспорт извлечённых таблиц в Excel 🔵Гибкая настройка параметров извлечения таблиц 🔵Быстрое извлечение таблиц с использованием алгоритмов компьютерного зрения ➡️Установка библиотеки: pip install img2table 📱 Репозиторий ➡️Справочник Программиста. Подписаться

🚀 img2table — это Python-библиотека для извлечения таблиц из изображений и PDF-файлов с последующим преобразованием их в структурированные данные (например, pandas DataFrame или Excel).

📌 Основные особенности:

🔵Извлечение таблиц из изображений (PNG, JPG и др.)

🔵Поддержка работы с PDF-документами

🔵Автоматическое обнаружение структуры таблиц (строки, столбцы и ячейки)

🔵Поддержка OCR для распознавания текста в таблицах

🔵Интеграция с Tesseract, EasyOCR, PaddleOCR, AWS Textract и Google Vision

🔵Преобразование таблиц в pandas.DataFrame

🔵Экспорт извлечённых таблиц в Excel

🔵Гибкая настройка параметров извлечения таблиц

🔵Быстрое извлечение таблиц с использованием алгоритмов компьютерного зрения

➡️Установка библиотеки: pip install img2table

📱 Репозиторий

➡️Справочник Программиста. Подписаться