Распознавание документов долго оставалось скучной инженерной задачей: извлечь текст, смириться с ошибками, вручную чинить таблицы. Но релиз Mistral OCR 3 неожиданно сдвигает эту область из «утилит» в категорию ключевой ИИ-инфраструктуры. И это гораздо важнее, чем просто рост точности. Mistral AI делает ставку не на максимальный размер модели, а на понимание структуры. OCR 3 — это не «прочитать текст», а восстановить документ как объект: с таблицами, полями, логикой формы и даже рукописными пометками. Что особенно бросается в глаза: 📄 Таблицы
Модель не «рисует текст по ячейкам», а реально восстанавливает структуру — с rowspan, colspan, многоуровневыми заголовками. Это критично, если документ дальше идёт в аналитику или RAG. ✍️ Рукописный текст
Большинство OCR либо игнорируют рукопись, либо превращают её в шум. Здесь же аккуратно читаются курсив, пометки поверх печатного текста и смешанные формы. 🧾 Плохие сканы
Скошенные страницы, низкий DPI, артефакты сжатия — OCR 3 явно обучали на ре