Компания Moonshot AI выпустила модель Kimi-Dev, которая работает как настоящий разработчик: анализирует проблему, находит нужные файлы, вносит правки и прогоняет тесты. Главное отличие Kimi-Dev от конкурентов — это её подход к обучению и работе. Она не просто генерирует код, она имитирует весь процесс исправления бага, как это делает живой разработчик. На известном тесте для программирующих нейросетей, SWE-bench, она обошла все существующие открытые модели и заняла первое место. Но цифры — это скучно. Интереснее то, как она это делает. Представьте себе ИИ, который получает "награду" не за то, что написал красивый код, а только если этот код реально починил программу и не сломал ничего другого. Именно так и учили Kimi-Dev. Разработчики создали для нейросети специальную "песочницу" на основе Docker. Модель брала реальную задачу из открытого репозитория, пыталась написать для неё исправление (патч) и запустить тесты. Если тесты проходили успешно — молодец, получай конфетку (в виде полож
Вышла нейросеть из Китая, которая сама находит и исправляет ошибки в коде
23 июня 202523 июн 2025
17
1 мин