27 января две самые заметные китайские стартап‑компании в области больших моделей почти синхронно выпустили крупные и при этом открытые обновления: DeepSeek представила DeepSeek‑OCR 2, а Kimi — K2.5. На первый взгляд это разные траектории развития: DeepSeek переосмысливает то, как модель “читает” информацию, а Kimi делает ставку на то, как модель выполняет сложные задачи. Но вместе эти релизы показывают более важный сдвиг: индустрия уходит от гонки «у кого больше параметров и красивее ответы» к гонке «у кого ИИ лучше встраивается в реальную работу — быстрее, дешевле и стабильнее». DeepSeek‑OCR 2: революция на входе — «читать документ как человек» Классический подход к документам (PDF, договоры, отчёты) у ИИ долго был механистическим: текст извлекается и подаётся модели токен за токеном. Это создаёт две системные проблемы: DeepSeek‑OCR 2 делает акцент на визуальном кодировании: документ рассматривается не как строка текста, а как визуальный объект, который нужно «прочитать». Идея в том
Одновременный поворот китайских LLM: DeepSeek «налево», Kimi «направо» — начинается эпоха борьбы за реальное внедрение
29 января29 янв
3 мин