1980 подписчиков

DeepSeek выпустили DeepSeek-OCR 2

29 января29 янв

~1 мин

Бесплатная. Открытая. Вместо стандартного сканирования слева направо, она использует архитектуру DeepEncoder V2, имитирующую человеческое зрение: нейросеть сначала оценивает общую структуру документа, а затем считывает информацию в логическом порядке. Это позволяет модели корректно обрабатывать сложные макеты, такие как таблицы и многоколончатая верстка, где традиционные алгоритмы часто «ломаются». Заявлено, что новая модель размером в 3 миллиарда параметров превосходит Gemini 3 Pro в задачах визуального понимания документов. Инструмент уже доступен для разработчиков: веса выложены на Hugging Face... Русский ИТ бизнес

DeepSeek выпустили DeepSeek-OCR 2. Бесплатная. Открытая.

Вместо стандартного сканирования слева направо, она использует архитектуру DeepEncoder V2, имитирующую человеческое зрение: нейросеть сначала оценивает общую структуру документа, а затем считывает информацию в логическом порядке. Это позволяет модели корректно обрабатывать сложные макеты, такие как таблицы и многоколончатая верстка, где традиционные алгоритмы часто «ломаются».

Заявлено, что новая модель размером в 3 миллиарда параметров превосходит Gemini 3 Pro в задачах визуального понимания документов. Инструмент уже доступен для разработчиков: веса выложены на Hugging Face...

Русский ИТ бизнес

Deep Seek

20,9 тыс интересуются