72 подписчика

Kimi K2.5: когда ИИ начинает работать роями и кодировать с видео

28 января28 янв

4 мин

Представьте: модель, которая не просто отвечает на вопросы, а координирует целый рой из сотни агентов, работающих параллельно. Звучит как научная фантастика? Но вот китайская компания Moonshot AI только что запустила Kimi K2.5 — апгрейд своей открытой модели K2, и это действительно меняет игру. Суть в том, что K2.5 встроила в себя прямо агентскую оркестровку. Забудьте про централизованные системы, которые принимают все решения: здесь агенты сами координируют друг друга. Это как улей — каждый работает на свою задачу, но все вместе добиваются общей цели. Для предприятий это означает просто огромный потенциал масштабирования. Вместо того чтобы строить всё больших моделей (что дорого и медленно), вы создаёте больше специализированных агентов, которые работают одновременно. Модель может управлять до 100 под-агентов и выполнять параллельные рабочие потоки из 1500 вызовов инструментов. Это действительно не шутка. Imagine that — задачи, которые раньше требовали дней работы, теперь можно

Оглавление

Китайская Moonshot AI выпустила то, что может серьёзно встряхнуть рынок
Что здесь особенного: оркестровка агентов
Benchmarks — это пол-правды

Китайская Moonshot AI выпустила то, что может серьёзно встряхнуть рынок

Что здесь особенного: оркестровка агентов

Суть в том, что K2.5 встроила в себя прямо агентскую оркестровку. Забудьте про централизованные системы, которые принимают все решения: здесь агенты сами координируют друг друга. Это как улей — каждый работает на свою задачу, но все вместе добиваются общей цели.

Для предприятий это означает просто огромный потенциал масштабирования. Вместо того чтобы строить всё больших моделей (что дорого и медленно), вы создаёте больше специализированных агентов, которые работают одновременно. Модель может управлять до 100 под-агентов и выполнять параллельные рабочие потоки из 1500 вызовов инструментов. Это действительно не шутка.

Imagine that — задачи, которые раньше требовали дней работы, теперь можно завершить за минуты. А всё потому, что всё происходит одновременно, а не по очереди.

Benchmarks — это пол-правды

Так, хорошо, но как K2.5 себя показывает в тестах? На тесте Humanity’s Last Exam (HLE) модель набрала 50.2% с использованием инструментов — выше, чем GPT-5.2 и Claude Opus 4.5. На SWE-bench Verified (тест для кодирования) она показала 76.8%.

Но, знаете, Moonshot сама говорит интересную вещь: бенчмарки — это всего лишь половина истории. Реально важно, сколько часов в день ИИ вам экономит. И здесь K2.5 работает совсем по-другому благодаря параллельным потокам.

Кодирование по видео — это вот это да

А вот здесь я остановлюсь подробнее. К2.5 — это мультимодальная модель, но не просто так. Она может смотреть на видео вашего сайта в действии и восстановить весь код. Не описание — именно просмотреть запись экрана и понять, что там происходит.

Интерфейсы, макеты, интерактивные элементы — всё это можно показать через скриншот или запись, а модель превратит это в рабочий сайт. Moonshot называет это «vibe coding» — кодирование по ощущению. Вроде как описать макет словами тяжело, а показать видео — раз, и готово.

Встроили это в новый инструмент Kimi Code — работает прямо в VSCode и Cursor. И что самое классное: модель сама может проверить свой результат визуально, сравнить с документацией и исправить ошибки вёрстки. Человеку даже не нужно смотреть на результат.

Цена — это действительно агрессивная стратегия

Moonshot снизила цены так, что это выглядит почти как издёвка над конкурентами:

Input: 0.6 центов за миллион токенов (минус 47.8% от K2 Turbo)
Cached Input: 0.1 центов за миллион токенов (минус 33.3%)
Output: 3 цента за миллион токенов (минус 62.5%)

Особенно актуально для агентского роя, потому что там нужно держать большие контексты. Кэшированные входы буквально спасают бюджет в таких сценариях.

Открытая, но не совсем: лицензия с изюминкой

K2.5 выпущена под Modified MIT License. Звучит стандартно, но есть интересный момент. Если вы использует модель в коммерческом продукте с более чем 100 миллионами ежемесячных пользователей или доходом свыше 20 миллионов долларов в месяц, нужно показывать «Kimi K2.5» в интерфейсе.

По сути, это означает: разработчики и стартапы могут использовать свободно, а вот мегакорпорациям не получится просто взять и скрыть источник. Это, кстати, мягче, чем у Meta с Llama — там порог был 700 миллионов пользователей и требовалась спецлицензия.

Почему это важно для вас прямо сейчас

За последние месяцы интерес к агентским роям просто взлетел. И вот теперь появляется открытая модель, которая это встроила прямо в себя. Можно использовать её как основу для своей системы агентов.

Но есть оговорка: некоторые компании предпочитают отделить обучение модели от оркестровки агентов. Они хотят гибкости — использовать разные модели для разных агентов, в зависимости от задачи. И тут есть альтернативы вроде Salesforce, AWS Bedrock или IBM, которые предоставляют свои инструменты для управления.

Правда, между ними есть одно существенное отличие: K2.5 встроила оркестровку внутрь модели. Для тех, кто хочет такой подход — это может быть идеально. Для остальных — может быть слишком.

В итоге: будущее уже здесь

По данным компании, между сентябрём и ноябрём количество пользователей K2 и K2 Thinking выросло на 170%. Люди реально интересуются тем, что здесь происходит.

K2.5 подсказывает нам будущее, где основное ограничение для инженерной команды — это не количество людей за клавиатурой, а способность лидеров скоординировать рой агентов. Один человек может управлять сотней под-агентов. Одна команда может делать работу, которая требовала полного отдела.

Это не просто улучшение — это смена парадигмы.

Разобраться с агентскими системами, моделями и их реальным применением — это становится критически важным прямо сейчас. Если вы не следите за тем, как меняется ИИ-ландшафт, можете просто отстать.🔔 Чтобы не пропустить крупные обновления в мире ИИ, открытых моделей и практического применения агентов, подпишитесь на мой канал «ProAI» в Telegram!