Найти в Дзене
Максим Кульгин

DeepSeek выпустили DeepSeek-OCR 2

Бесплатная. Открытая. Вместо стандартного сканирования слева направо, она использует архитектуру DeepEncoder V2, имитирующую человеческое зрение: нейросеть сначала оценивает общую структуру документа, а затем считывает информацию в логическом порядке. Это позволяет модели корректно обрабатывать сложные макеты, такие как таблицы и многоколончатая верстка, где традиционные алгоритмы часто «ломаются». Заявлено, что новая модель размером в 3 миллиарда параметров превосходит Gemini 3 Pro в задачах визуального понимания документов. Инструмент уже доступен для разработчиков: веса выложены на Hugging Face... Русский ИТ бизнес

DeepSeek выпустили DeepSeek-OCR 2. Бесплатная. Открытая.

Вместо стандартного сканирования слева направо, она использует архитектуру DeepEncoder V2, имитирующую человеческое зрение: нейросеть сначала оценивает общую структуру документа, а затем считывает информацию в логическом порядке. Это позволяет модели корректно обрабатывать сложные макеты, такие как таблицы и многоколончатая верстка, где традиционные алгоритмы часто «ломаются».

Заявлено, что новая модель размером в 3 миллиарда параметров превосходит Gemini 3 Pro в задачах визуального понимания документов. Инструмент уже доступен для разработчиков: веса выложены на Hugging Face...

Русский ИТ бизнес

Deep Seek
20,9 тыс интересуются