Стартап DeepSeek представил новую модель искусственного интеллекта DeepSeek-OCR, которая может анализировать большие и сложные документы, используя меньше данных и снижая затраты на обработку, пишет SCMP . Модель с открытым исходным кодом уже доступна на платформах Hugging Face и GitHub. Она сочетает визуальное восприятие и текстовую обработку, что позволяет «сжимать» текстовую информацию без потери смысла. По данным разработчиков, технология сокращает объем данных, необходимых для работы, в 7–20 раз. В основе DeepSeek-OCR лежит система из двух компонентов: DeepEncoder, который выполняет сжатие информации, и декодер Mixture-of-Experts с 570 млн параметров, отвечающий за восстановление текста. В тестах производительности модель превзошла решения GOT-OCR 2.0 и MinerU 2.0, при этом потребовала меньше вычислительных ресурсов. DeepSeek утверждает, что новая технология поможет эффективнее обрабатывать объемные юридические, финансовые и научные документы. Модель может распознавать таблицы, гр
DeepSeek представила новую ИИ-модель DeepSeek-OCR
21 октября 202521 окт 2025
20
~1 мин