Специализированные OCR и парсеры документов. Подходят для PDF, таблиц, сканов и сложных макетов. Подборка ниже, по названию легко найдете. 1. GOT-OCR Универсальная модель "всё-в-одном". Сразу выдает текст в HTML, сохраняя форматирование (таблицы, заголовки). Удобна для преобразования сканов в читаемые веб-страницы. 2. granite-docling-258m Очень лёгкая модель (258M параметров). Создана для библиотеки Docling. Подходит для локальной работы на CPU, если нужно просто разобрать структуру документа без глубокого анализа. 3. MinerU 2.5 Отлично превращает PDF в Markdown, особенно научные статьи и документы со сложной вёрсткой. 4. OCRFlux Модель для очистки и восстановления текста из "грязных" или повреждённых сканов. Подходит для восстановления плохого качества PDF. 5. RolmOCR Специализация - бизнес-документы (счета, чеки, формы). Выделяет нужные поля с высокой точностью. 6. Nanonets OCR Идеальна для извлечения данных из финансовых и юридических документов с чёткой структурой. 7. Deepse