Найти в Дзене
SkyNet | Новости ИИ

Помощь ИИ-агентам в поиске лучших результатов с помощью больших языковых моделей

Искусственный интеллект (ИИ) становится незаменимым помощником в самых разных сферах: от научных исследований до автоматизации задач в сфере управления персоналом или финансов. В частности, многие профессионалы используют возможности полуавтономных программных систем, называемых ИИ-агентами, которые могут обращаться к ИИ для решения задач и выполнения рутинных операций. ИИ-агенты особенно эффективны, когда используют большие языковые модели (LLM), поскольку эти системы мощные, эффективные и адаптивные. Один из способов программирования такой технологии — описать в коде, что вы хотите, чтобы ваша система делала (рабочий процесс), включая использование LLM в определённых точках. Например, если вы представляете собой компанию-разработчика программного обеспечения, которая пытается обновить свою старую кодовую базу, чтобы использовать более современный язык программирования для оптимизации и повышения безопасности, вы можете создать систему, которая использует LLM для перевода кодовой ба

Помощь ИИ-агентам в поиске лучших результатов с помощью больших языковых моделей

Искусственный интеллект (ИИ) становится незаменимым помощником в самых разных сферах: от научных исследований до автоматизации задач в сфере управления персоналом или финансов. В частности, многие профессионалы используют возможности полуавтономных программных систем, называемых ИИ-агентами, которые могут обращаться к ИИ для решения задач и выполнения рутинных операций.

ИИ-агенты особенно эффективны, когда используют большие языковые модели (LLM), поскольку эти системы мощные, эффективные и адаптивные. Один из способов программирования такой технологии — описать в коде, что вы хотите, чтобы ваша система делала (рабочий процесс), включая использование LLM в определённых точках.

Например, если вы представляете собой компанию-разработчика программного обеспечения, которая пытается обновить свою старую кодовую базу, чтобы использовать более современный язык программирования для оптимизации и повышения безопасности, вы можете создать систему, которая использует LLM для перевода кодовой базы по одному файлу за раз, тестируя каждый файл по ходу работы.

Однако что происходит, когда LLM допускают ошибки? Вам нужно, чтобы агент вернулся назад и сделал ещё одну попытку, учтя уроки, извлечённые из предыдущих ошибок. Кодирование этого может потребовать столько же усилий, сколько и реализация исходного агента. Если ваша система для перевода кодовой базы содержит тысячи строк кода, вам придётся внести тысячи изменений или дополнений в код, чтобы поддержать логику возврата назад при ошибках LLM.

Решение от MIT и Asari AI

Чтобы сэкономить время и усилия программистов, исследователи из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (MIT CSAIL) и Asari AI разработали фреймворк под названием EnCompass.

С помощью EnCompass вам больше не нужно вносить эти изменения самостоятельно. Вместо этого, когда EnCompass запускает вашу программу, он автоматически возвращается назад, если LLM допускают ошибки. EnCompass также может создавать копии среды выполнения программы для параллельных попыток поиска наилучшего решения.

В общем случае EnCompass ищет различные возможные пути, которые может выбрать ваш агент, в результате различных возможных выходов всех вызовов LLM, ища путь, на котором LLM находит наилучшее решение.

Всё, что вам нужно сделать, — это аннотировать места, где вы хотите, чтобы программа возвращалась назад или клонировала среду выполнения программы, а также записать любую информацию, которая может быть полезна для стратегии поиска по различным возможным путям выполнения вашего агента (стратегия поиска). Вы можете отдельно указать стратегию поиска — вы можете использовать одну из тех, что EnCompass предоставляет «из коробки», или, при желании, реализовать собственную пользовательскую стратегию поиска.

«С помощью EnCompass мы отделили стратегию поиска от основного рабочего процесса ИИ-агента», — говорит ведущий автор Чжэнин Ли, докторант MIT в области электротехники и компьютерных наук (EECS), исследова...

Читать далее