Китайская компания DeepSeek на неделе представила языковую модель DeepSeek-R1 с открытым исходным кодом, заявив о её рекордной производительности. Тестирование показало, что модель не только успешно конкурирует с современными решениями от OpenAI, но и превосходит аналогичные продукты Anthropic в математике, программировании и анализе текстов. Но разработка оказалась избирательной в обсуждениях, потому что ИИ-модель уклоняется от тем, связанных с событиями на площади Тяньаньмэнь, снимком «Танкиста», Винни-Пухом, статусом Тайваня и китайскими хакерами. Специалисты уже активно обсуждают возможности DeepSeek-R1 в соцсетях, говоря о её высоком уровне. Китайские разработчики же сравнивают своё решение с продуктом OpenAI o1-1217, подчёркивая достижения своей модели в решении задач, требующих сложных умозаключений. На тестировании AIME 2024 DeepSeek-R1 показала результат 79,8% Pass@1, что позволило ей опередить конкурента от OpenAI. В испытаниях MATH-500 модель достигла показателя в 97,3%, сра
Китайский ИИ нового поколения игнорирует разговоры о Винни-Пухе и внутренних проблемах КНР
22 января 202522 янв 2025
2
2 мин