18 подписчиков

Что такое ИИ-агенты: от уровня секретаря до руководителя

16 декабря 202416 дек 2024

112

7 мин

🤖 AI-агенты — программное обеспечение на базе искусственного интеллекта, которое выполняет для вас ряд задач, ранее выполнявшихся агентами службы поддержки клиентов, сотрудниками отдела кадров или специалистами технической поддержки. 🔄 Агенты могут выполнять задачи, связанные с пересечением нескольких систем, выходя за рамки простого ответа на вопросы. Например, компания Perplexity выпустила AI-агента, который помогает людям выбирать подарки к праздникам, а Google анонсировал своего первого AI-агента под названием Project Mariner, способного найти авиабилеты и отели, помочь с покупкой товаров для дома, поиском рецептов и другими задачами. 🤔 Отсутствие чёткого определения понятия «AI-агент» создаёт путаницу в понимании их функций. Различные компании и эксперты имеют разные представления о том, что такое AI-агент. Для одних это помощники, основанные на задачах, для других — дополнительные сотрудники, для третьих — инструменты улучшения взаимодействия с клиентами. Агенты искусственного

Оглавление

Сперва главное:
Теперь подробнее:

Сперва главное:

🔄 Агенты могут выполнять задачи, связанные с пересечением нескольких систем, выходя за рамки простого ответа на вопросы. Например, компания Perplexity выпустила AI-агента, который помогает людям выбирать подарки к праздникам, а Google анонсировал своего первого AI-агента под названием Project Mariner, способного найти авиабилеты и отели, помочь с покупкой товаров для дома, поиском рецептов и другими задачами.

🤔 Отсутствие чёткого определения понятия «AI-агент» создаёт путаницу в понимании их функций. Различные компании и эксперты имеют разные представления о том, что такое AI-агент. Для одних это помощники, основанные на задачах, для других — дополнительные сотрудники, для третьих — инструменты улучшения взаимодействия с клиентами.

Теперь подробнее:

Агенты искусственного интеллекта должны стать следующим большим достижением в области ИИ, но точного определения того, что они собой представляют, не существует. На данный момент люди не могут прийти к единому мнению о том, что именно представляет собой агент ИИ.

Проще говоря, агент ИИ лучше всего описывается как программное обеспечение на базе ИИ, которое выполняет за вас ряд заданий, которые раньше выполнял бы агент по обслуживанию клиентов, специалист по персоналу или сотрудник службы поддержки ИТ, хотя в конечном итоге это может быть любая задача. Вы просите его что-то сделать, и он делает это за вас, иногда пересекая несколько систем и выходя далеко за рамки простого ответа на вопросы. Например, в прошлом месяце компания Perplexity выпустила агента ИИ, который помогает людям делать покупки к праздникам (и это не единственный пример). А Google на прошлой неделе анонсировал своего первого агента ИИ под названием Project Mariner, которого можно использовать для поиска авиабилетов и отелей, покупки предметов домашнего обихода, поиска рецептов и выполнения других задач.

Кажется, всё достаточно просто, верно? Однако это осложняется отсутствием ясности. Даже среди технологических гигантов нет единого мнения. Google рассматривает их как помощников, основанных на задачах, в зависимости от работы: помощь разработчикам в кодировании; помощь маркетологам в создании цветовой схемы; помощь специалисту по ИТ в отслеживании проблемы путём запроса данных журнала.

Для Asana агент может действовать как дополнительный сотрудник, выполняя поставленные задачи, как любой хороший коллега. Sierra, стартап, основанный бывшим со-генеральным директором Salesforce Бретом Тейлором и ветераном Google Клэем Бавором, рассматривает агентов как инструменты взаимодействия с клиентами, помогающие людям выполнять действия, выходящие далеко за рамки чат-ботов прошлого, чтобы решать более сложные задачи.

Отсутствие согласованного определения оставляет место для путаницы относительно того, что именно будут делать эти устройства, но независимо от того, как они определены, агенты предназначены для помощи в выполнении задач автоматизированным способом с минимальным взаимодействием с человеком.

Рудина Сесери, основатель и управляющий партнёр Glasswing Ventures, говорит, что сейчас только начало, и это может объяснить отсутствие согласия. «Единого определения понятия «агент ИИ» не существует. Однако наиболее распространённое мнение заключается в том, что агент — это интеллектуальная программная система, предназначенная для восприятия окружающей среды, осмысления её, принятия решений и действий для достижения конкретных целей автономно», — сказала Сесери.

Она говорит, что для этого они используют ряд технологий ИИ. «Эти системы включают в себя различные методы ИИ/МО, такие как обработка естественного языка, машинное обучение и компьютерное зрение, для работы в динамических областях автономно или вместе с другими агентами и пользователями-людьми».

Аарон Леви, соучредитель и генеральный директор Box, говорит, что со временем, когда ИИ станет более способным, агенты ИИ смогут делать гораздо больше от имени людей, и уже существует динамика, которая будет способствовать этой эволюции.

«У агентов ИИ есть несколько компонентов самоподдерживающегося маховика, который позволит значительно улучшить то, что агенты ИИ могут достичь в краткосрочной и долгосрочной перспективе: соотношение цены и производительности графических процессоров, эффективность моделей, качество и интеллектуальность моделей, улучшения фреймворков и инфраструктуры ИИ», — написал Леви недавно в LinkedIn.

Это оптимистичный взгляд на технологию, предполагающий, что рост будет происходить во всех этих областях, хотя это не обязательно данность. Пионер робототехники из Массачусетского технологического института Родни Брукс отметил, что ИИ приходится решать гораздо более сложные проблемы, чем большинству технологий, и его развитие не обязательно будет таким же быстрым, как, скажем, у чипов в соответствии с законом Мура.

«Когда человек видит, как система ИИ выполняет задачу, он сразу же обобщает её на похожие вещи и оценивает компетентность системы ИИ; не только её производительность в этом, но и компетентность в этом», — сказал Брукс. «И обычно они слишком оптимистичны, и это потому, что они используют модель выполнения человеком задачи».

Проблема в том, что объединение систем сложно, и это усложняется тем фактом, что некоторые устаревшие системы не имеют базового доступа к API. Хотя мы наблюдаем устойчивые улучшения, о которых говорил Леви, заставить программное обеспечение получать доступ к нескольким системам при решении проблем, с которыми оно может столкнуться на этом пути, может оказаться сложнее, чем многие думают.

Если это так, то все могут переоценивать возможности агентов ИИ. Дэвид Кушман, руководитель исследований HFS Research, рассматривает нынешний набор ботов скорее как Асана: помощников, которые помогают людям выполнять определённые задачи в интересах достижения какой-либо стратегической цели, определённой пользователем. Задача состоит в том, чтобы помочь машине справляться с непредвиденными обстоятельствами действительно автоматизированным способом, и мы явно ещё далеки от этого.

«Я думаю, что это следующий шаг», — сказал он. «Именно здесь ИИ работает независимо и эффективно в масштабе. Итак, здесь люди устанавливают руководящие принципы, ограничения и применяют множество технологий, чтобы исключить человека из цикла — когда всё было направлено на то, чтобы держать человека в цикле с GenAI», — сказал он. Таким образом, ключевым моментом, по его словам, является позволить агенту ИИ взять верх и применить настоящую автоматизацию.

Джон Туров, партнёр Madrona Ventures, говорит, что для этого потребуется создание инфраструктуры агентов ИИ, технологического стека, разработанного специально для создания агентов (независимо от того, как вы их определяете). В недавней публикации в блоге Туров привёл примеры агентов ИИ, работающих в настоящее время в полевых условиях, и то, как они создаются сегодня.

По мнению Турова, растущее распространение агентов ИИ — и он признаёт, что определение всё ещё немного неуловимо — требует технологического стека, как и любой другой технологии. «Всё это означает, что нашей отрасли предстоит проделать работу по созданию инфраструктуры, поддерживающей агентов ИИ и приложения, которые на них полагаются», — написал он в статье.

«Со временем рассуждения будут постепенно улучшаться, передовые модели начнут управлять большей частью рабочих процессов, и разработчики захотят сосредоточиться на продукте и данных — вещах, которые их отличают. Они хотят, чтобы базовая платформа «просто работала» с точки зрения масштаба, производительности и надёжности».

Ещё одна вещь, которую следует иметь в виду, это то, что, вероятно, потребуется несколько моделей, а не одна LLM, чтобы заставить агентов работать, и это имеет смысл, если вы думаете об этих агентах как о наборе различных задач. «Я не думаю, что прямо сейчас какая-либо отдельная большая языковая модель, по крайней мере, общедоступная, монолитная большая языковая модель способна выполнять агентские задачи. Я не думаю, что они пока могут выполнять многоэтапные рассуждения, которые действительно заставили бы меня волноваться об агентском будущем. Я думаю, мы приближаемся, но этого пока нет», — сказал Фред Хавмейер, руководитель отдела исследований в области искусственного интеллекта и программного обеспечения в США в Macquarie US Equity Research.

«Я действительно думаю, что наиболее эффективными агентами, вероятно, будут несколько наборов из нескольких разных моделей со слоем маршрутизации, который отправляет запросы или подсказки наиболее эффективному агенту и модели. И я думаю, что это было бы похоже на автоматизированного руководителя, делегирующего роль».

В конечном счёте, по мнению Хавмейера, отрасль стремится к тому, чтобы агенты работали автономно. «Думая о будущем агентов, я хочу видеть и надеюсь увидеть агентов, которые действительно автономны и способны ставить абстрактные цели, а затем полностью независимо продумывать все промежуточные шаги», — сказал он.

Но дело в том, что мы всё ещё находимся в переходном периоде, когда речь идёт об этих агентах, и мы не знаем, когда мы придём к конечному состоянию, описанному Хавмейером. Хотя то, что мы видели до сих пор, явно является многообещающим шагом в правильном направлении, нам всё ещё нужны некоторые достижения и прорывы, чтобы агенты ИИ работали так, как это предполагается сегодня. И важно понимать, что мы ещё не достигли этого уровня.