24 подписчика

Kimi K2.5: Китайский ИИ с роем агентов обходит конкурентов

27 января27 янв

2 мин

Китайская Moonshot AI представила Kimi K2.5 – мультимодальную модель с инновационным режимом Agent Swarm. Этот режим позволяет ИИ самостоятельно создавать до 100 параллельных субагентов и координировать до 1500 вызовов инструментов в течение одной сессии, что, по утверждению компании, ускоряет решение сложных задач в 4,5 раза по сравнению с использованием одного агента. Kimi K2.5 основана на предыдущей версии K2 и дообучена на 15 триллионах мультимодальных токенов. Ключевой технологической особенностью является метод PARL (Parallel-Agent Reinforcement Learning), который представляет собой обучаемый оркестратор, декомпозирующий задачу на параллельные подзадачи и распределяющий их между субагентами. Разработчики успешно решили проблему последовательного выполнения задач, внедрив метрику Critical Steps и поэтапную систему вознаграждения. Особое внимание уделено кодингу с использованием визуального ввода. Kimi K2.5 способна генерировать код на основе видеозаписей, например, воссоздавая веб

Kimi K2.5 основана на предыдущей версии K2 и дообучена на 15 триллионах мультимодальных токенов. Ключевой технологической особенностью является метод PARL (Parallel-Agent Reinforcement Learning), который представляет собой обучаемый оркестратор, декомпозирующий задачу на параллельные подзадачи и распределяющий их между субагентами. Разработчики успешно решили проблему последовательного выполнения задач, внедрив метрику Critical Steps и поэтапную систему вознаграждения.

Особое внимание уделено кодингу с использованием визуального ввода. Kimi K2.5 способна генерировать код на основе видеозаписей, например, воссоздавая веб-сайт по видео экрана. Также заявлена функция автономного визуального отладки, позволяющая модели самостоятельно оценивать и исправлять результаты своей работы. Для разработчиков представлен Kimi Code – терминальный инструмент с открытым исходным кодом, интегрируемый с VSCode, Cursor и Zed, принимающий изображения и видео и автоматически импортирующий MCP-конфигурации.

В режиме Thinking модель демонстрирует лидерство в визуальных бенчмарках: OCRBench – 92,3 (против 80,7 у GPT-5.2), InfoVQA – 92,6 (против 84,0), MathVista – 90,1 (лучший результат). Однако в задачах, требующих логического мышления, Kimi K2.5 уступает лидерам: на AIME 2025 – 96,1 против 100 у GPT-5.2, на GPQA-Diamond – 87,6 против 92,4.

Режим Agent Swarm компенсирует эти недостатки в практических задачах. На BrowseComp рой агентов набирает 78,4 балла против 60,6 у одиночной Kimi K2.5 и 37,0 у Claude Opus 4.5. На внутреннем бенчмарке Wide Search – 79,0 против 72,7. Moonshot утверждает, что Kimi K2.5 обеспечивает экономию от 5 до 21 раза по сравнению с GPT-5.2 при сопоставимом качестве. Модель предназначена для масштабного поиска информации, генерации объемных документов и пакетной обработки данных. Режимы Instant и Thinking доступны бесплатно, а Agent Swarm работает по подписке от $31 в месяц.

Ну что ж, похоже, теперь даже искусственный интеллект устал работать в одиночку и решил нанять себе помощников. Интересно, кто будет оплачивать их труд?