Добавить в корзинуПозвонить
Найти в Дзене
PythonTalk

Вышла нейросеть из Китая, которая сама находит и исправляет ошибки в коде

Компания Moonshot AI выпустила модель Kimi-Dev, которая работает как настоящий разработчик: анализирует проблему, находит нужные файлы, вносит правки и прогоняет тесты. Главное отличие Kimi-Dev от конкурентов — это её подход к обучению и работе. Она не просто генерирует код, она имитирует весь процесс исправления бага, как это делает живой разработчик. На известном тесте для программирующих нейросетей, SWE-bench, она обошла все существующие открытые модели и заняла первое место. Но цифры — это скучно. Интереснее то, как она это делает. Представьте себе ИИ, который получает "награду" не за то, что написал красивый код, а только если этот код реально починил программу и не сломал ничего другого. Именно так и учили Kimi-Dev. Разработчики создали для нейросети специальную "песочницу" на основе Docker. Модель брала реальную задачу из открытого репозитория, пыталась написать для неё исправление (патч) и запустить тесты. Если тесты проходили успешно — молодец, получай конфетку (в виде полож
Оглавление

Компания Moonshot AI выпустила модель Kimi-Dev, которая работает как настоящий разработчик: анализирует проблему, находит нужные файлы, вносит правки и прогоняет тесты.

Новый игрок: в чём главная фишка Kimi-Dev?

Главное отличие Kimi-Dev от конкурентов — это её подход к обучению и работе. Она не просто генерирует код, она имитирует весь процесс исправления бага, как это делает живой разработчик.

На известном тесте для программирующих нейросетей, SWE-bench, она обошла все существующие открытые модели и заняла первое место. Но цифры — это скучно. Интереснее то, как она это делает.

Представьте себе ИИ, который получает "награду" не за то, что написал красивый код, а только если этот код реально починил программу и не сломал ничего другого. Именно так и учили Kimi-Dev.

Как они научили её думать?

Разработчики создали для нейросети специальную "песочницу" на основе Docker. Модель брала реальную задачу из открытого репозитория, пыталась написать для неё исправление (патч) и запустить тесты.

Если тесты проходили успешно — молодец, получай конфетку (в виде положительного подкрепления). Если нет — думай дальше. Такой спартанский подход отсеивает 99% мусорных решений.

Мыслит как программст: два режима работы

Kimi-Dev работает в двух основных режимах, как два специалиста в одной команде:

  1. BugFixer (Ремонтник): Анализирует описание бага, находит нужные файлы в проекте и вносит туда правки.
  2. TestWriter (Тестировщик): Пишет новые тесты, которые должны упасть на старом коде и пройти на исправленном.

Этот двухэтапный процесс — сначала найти, где проблема, а потом её исправить — гораздо эффективнее, чем пытаться вслепую генерировать код.

Kimi-Dev — это, конечно, ещё не полноценная замена программисту. Она хорошо справляется с точечными, хорошо описанными задачами, но не сможет спроектировать сложную систему с нуля.

Потыкать можно тут:

👉🏻 GitHub

👉🏻 Hugging Face

👉🏻 Демка-чат