Найти в Дзене
Ferra.ru

ИИ без логики, но с умом: чем интересен Kimi-K2, который превзошёл GPT-4

Китайская компания Moonshot AI представила Kimi-K2 — новую крупную языковую модель с открытыми весами, способную конкурировать с коммерческими аналогами, такими как GPT-4.1 и Claude Sonnet 4. Модель не имеет специализированного модуля логического вывода, но демонстрирует высокие результаты в программировании, математике и мультиязычных задачах.

Никита Сушко — младший научный сотрудник группы «Прикладное NLP» Института AIRI — рассказал о ключевых особенностях Kimi-K2 и её потенциале. Kimi-K2 построена на архитектуре Mixture of Experts (MoE), где вместо одной глубокой модели используются множество более простых «экспертов». Это позволяет ускорить генерацию ответов и увеличить объём знаний, которые модель может применять.

Несмотря на огромное число параметров, скорость работы модели остаётся сопоставимой с предшественниками благодаря оптимизированной структуре.

На тестах, связанных с кодом, Kimi-K2 показывает высокие результаты. Например, на SWE-bench Verified, где модели нужно находить и исправлять ошибки в реальных проектах, она набрала 65,8%, обойдя GPT-4.1 (54,6%) и уступив лишь Claude Sonnet 4.

   Ferra.ru
Ferra.ru

Модель также лидирует в LiveCodeBench (53,7%) и OJBench (27,1%), демонстрируя способность решать интерактивные и соревновательные задачи по программированию.

Moonshot AI позиционирует Kimi-K2 как модель для агентных приложений — она умеет выполнять команды, вызывать внешние инструменты, генерировать и исправлять код, а также решать многошаговые задачи.

Например, модель может проанализировать данные о зарплатах, провести статистическую оценку и создать интерактивную HTML-страницу с рекомендациями — всё в одном процессе.

Moonshot AI, основанная в 2023 году, получила серьёзную поддержку от китайских гигантов Tencent, Alibaba и Gaorong Capital. Появление Kimi-K2 укрепляет позиции Китая в гонке ИИ, где уже есть такие модели, как Deepseek и Qwen.

Открытость весов позволяет развёртывать модель на собственных мощностях, что делает её привлекательной для разработчиков и компаний.

Создатели Kimi-K2 планируют добавить модуль логического вывода, что может ещё больше повысить её эффективность. Пока же модель уже доказала свою конкурентоспособность в ключевых задачах — от программирования до сложных математических вычислений.