Мы и раньше видели новости о достижениях китайских компаний в области LLM, но вышедшая на днях модель DeepSeek-R1 удивляет даже на фоне предыдущих громких релизов. Компания не только бросила вызов лидерам индустрии на Западе, но и подтвердила высокий уровень китайских разработок. Обо всём по порядку. R1 — это «думающая» модель с 671 миллиардом параметров, одна из самых больших на рынке. Бенчмарки и тесты показывают, что по качеству она сравнима с одной из самых продвинутых моделей от OpenAI — o1 (правда, та уже относится к предыдущему поколению), с особенно сильными результатами в математике и кодинге. Достижения модели — результат в том числе необычного и инновационного подхода к обучению. R1 обучалась исключительно методом обучения с подкреплением (Reinforcement Learning), без привычного этапа предварительного обучения на огромном массиве данных. Это позволило R1 развить эмерджентные свойства, то есть экспериментировать и действовать не так, как задумали авторы. Она способна к «самоа
Что за DeepSeek и почему их новая модель — прорыв в ИИ?
29 января 202529 янв 2025
29
2 мин