Найти в Дзене

Познание выходит из скрытности, чтобы запустить разработчика программного обеспечения для искусственного интеллекта Девина

Сегодня Cognition, недавно созданный стартап в области искусственного интеллекта, поддерживаемый Фондом основателей Питера Тиля и лидерами технологической отрасли, включая бывшего руководителя Twitter Элада Гиля и соучредителя Doordash Тони Сюя, объявил о создании полностью автономного инженера-программиста ИИ под названием «Девин». Несмотря на то, что существует множество помощников по кодированию, в том числе знаменитый Github Copilot, Devin выделяется из толпы своей способностью обрабатывать целые проекты разработки от начала до конца, начиная с написания кода и исправления связанных с ним ошибок и заканчивая окончательным выполнением. Это первое предложение такого рода, способное даже работать с проектами на Upwork, продемонстрировал стартап. Объявление Девина знаменует собой значительный сдвиг в пространстве разработки с помощью ИИ, предоставляя инженерам полноценного ИИ-работника для своих проектов, а не второго пилота, который может просто писать голый код или предлагать фрагмен
Оглавление

Сегодня Cognition, недавно созданный стартап в области искусственного интеллекта, поддерживаемый Фондом основателей Питера Тиля и лидерами технологической отрасли, включая бывшего руководителя Twitter Элада Гиля и соучредителя Doordash Тони Сюя, объявил о создании полностью автономного инженера-программиста ИИ под названием «Девин».

Несмотря на то, что существует множество помощников по кодированию, в том числе знаменитый Github Copilot, Devin выделяется из толпы своей способностью обрабатывать целые проекты разработки от начала до конца, начиная с написания кода и исправления связанных с ним ошибок и заканчивая окончательным выполнением. Это первое предложение такого рода, способное даже работать с проектами на Upwork, продемонстрировал стартап.

Объявление Девина знаменует собой значительный сдвиг в пространстве разработки с помощью ИИ, предоставляя инженерам полноценного ИИ-работника для своих проектов, а не второго пилота, который может просто писать голый код или предлагать фрагменты.

Тем не менее, на данный момент Девин остается непубличным, и компания открыла доступ только нескольким избранным клиентам, включая журналиста Bloomberg Эшли Вэнса, который написал о своем опыте использования здесь.

Что именно может сделать Девин?

В сегодняшнем сообщении в блоге на веб-сайте Cognition Скотт Ву, основатель и генеральный директор Cognition и отмеченный наградами спортивный программист, объяснил, что Devin может получить доступ к общим инструментам разработчика, включая собственную оболочку, редактор кода и браузер, в изолированной вычислительной среде для планирования и выполнения сложных инженерных задач, требующих тысяч решений.

Человек-пользователь просто вводит подсказку на естественном языке в интерфейс чат-бота Девина, а инженер-программист ИИ берет ее оттуда, разрабатывая подробный, пошаговый план решения проблемы. Затем он начинает проект, используя свои инструменты разработчика, точно так же, как их использует человек, пишет свой собственный код, исправляет проблемы, тестирует и сообщает о своем прогрессе в режиме реального времени, позволяя пользователю следить за всем, что работает.

Если что-то выглядит не так, как надо, пользователь также может зайти в интерфейс чата и дать ИИ команду исправить это. Это, по словам Cognition, позволяет инженерным командам делегировать некоторые из своих проектов искусственному интеллекту и сосредоточиться на более творческих задачах, требующих человеческого интеллекта.

Таким образом, Девин предлагает новую парадигму, которая может стать проблеском того, как вся разработка программного обеспечения — и компьютерная работа в целом — может выполняться в ближайшем будущем: работниками ИИ под наблюдением руководителей/пользователей.

Способен справляться с широким спектром задач разработки

Согласно демо-версиям, которыми поделился Ву, Devin способен справляться с целым рядом задач в своем нынешнем виде. Это включает в себя как обычные инженерные проекты, такие как развертывание и улучшение приложений/веб-сайтов, поиск и исправление ошибок в кодовых базах, так и более сложные вещи, такие как настройка тонкой настройки для большой языковой модели с помощью ссылки на исследовательский репозиторий на GitHub или обучение использованию незнакомых технологий.

В одном случае он узнал из сообщения в блоге, как запускать код для создания изображений со скрытыми сообщениями. В то же время в другом случае она обрабатывала проект Upwork для запуска модели компьютерного зрения, написав и отладив для нее код.

В тесте SWE, в котором помощникам ИИ бросают вызов проблемы GitHub из реальных проектов с открытым исходным кодом, инженер-программист с искусственным интеллектом смог правильно решить 13,86% случаев от начала до конца — без какой-либо помощи со стороны человека. Для сравнения, Claude 2 может решить только 4,80% проблем, в то время как SWE-Llama-13b и GPT-4 могут справиться с 3,97% и 1,74% проблем соответственно. Всем этим моделям даже требовалась помощь, где им говорили, какой файл нужно исправить.

-2

Основная технология остается неописанной

Искусственный интеллект в разработке программного обеспечения не является чем-то новым. Инструменты в этой области существуют уже довольно давно, начиная с популярных GitHub Copilot и StarCoder и заканчивая Replit, у которого есть несколько небольших моделей программирования ИИ на Hugging Face, и Codeium, который недавно привлек финансирование серии B в размере 65 миллионов долларов при оценке в 500 миллионов долларов.

Однако большинство из этих предложений в основном сосредоточены на использовании ИИ для помощи в написании кода. Они могут генерировать базовый код из текстовых подсказок, обобщать его с соответствующим контекстом IDE или извлекать фрагменты, ускоряя рабочий процесс команды. С Devin Cognition AI, похоже, идет на шаг (или несколько шагов) дальше, предоставляя полноценного ИИ-работника для работы над целыми проектами.

Несмотря на то, что инструмент еще предстоит протестировать, его способность выполнять несколько шагов для завершения проекта по разработке программного обеспечения является самым большим уникальным коммерческим преимуществом. Cognition не сообщила, как именно она достигла этого результата и использует ли она свою собственную запатентованную модель или модель третьей стороны, но отмечает, что работа является результатом ее «достижений в долгосрочном мышлении и планировании».

В настоящее время компания находится в процессе наращивания мощностей и предлагает ранний доступ к Devin только избранным пользователям. В нем говорится, что заинтересованные стороны, желающие улучшить свою инженерную работу, могут связаться с нами по электронной почте, чтобы получить доступ. Ожидается, что на более позднем этапе будет открыт более широкий доступ.

Cognition также отмечает на своем веб-сайте, что кодирование — это «только начало», что, по-видимому, указывает на то, что компания может использовать свои достижения в области рассуждений для запуска аналогичных агентов/работников ИИ и для других дисциплин. На данный момент компания получила финансирование в размере 21 миллиона долларов.