39 подписчиков

Часть 1. Куда все идеи с ИИ? Где реально крутое? Все истерят про Агентов, но я верю есть нечто гораздо большее.

На текущий момент я наблюдаю несколько крупных доменов, в которых могут использоваться языковые модели, учитывая текущий уровень их развития, доступные технологии и инструменты.

Самый базовый уровень, который используют практически 99% людей, в принципе пытающихся их применять, — это простые вопросы или простые поручения. Начиная с «найди мне рецепт супа», «найди мне что-то». По факту большая часть людей на данном этапе используют модели как более продвинутые версии поиска в интернете. Причём эта функция настолько востребована, что практически все вендоры моделей уже выкатили специализированную функцию поиска. Причём не просто «найди мне что-то», а углублённого поиска — с возможностью делать отчёты и так далее. Это, конечно, экономит время, но, как правило, это самый незначительный уровень запроса «найди мне что-то».

Второй уровень — это когда люди просят модель что-то сделать, как правило, создать какой-то тип контента или выполнить задачи, связанные с текстом: «создай мне текст», «проанализируй текст», «отредактируй текст» либо «создай какое-то изображение». Если в целом говорить о генеративных моделях, то можно создавать разные мультимодальные типы контента, но для простоты понимания лучше сосредоточиться на всём, что связано с текстом. То есть это создание собственного текста, анализ текстов, а также код, потому что код — это просто разновидность текста. Всё, что касается мультимедийного контента, — значительно более узкая сфера. В этом смысле основные запросы связаны с различными операциями над текстом или данными. То есть «создай», «найди», «проанализируй», «найди закономерность», «отредактируй», «суммаризируй» — вот такого плана вещи. Это тоже достаточно примитивный уровень. С моей точки зрения, это использование лишь 1% возможностей модели.

Третий уровень, который сейчас активно развивается, — это создание так называемых кастомные ассистенты, когда модель может выполнять автоматизированные рутинные действия. Простейший пример — кастомные GPT, так называемые GPT-шки или GPTs. Когда у нас есть набор рутинных, часто повторяющихся действий (которые, кстати, могут быть достаточно сложными и включать взаимодействие с интернетом, сервисами и так далее), их можно реализовать в концепции кастомных GPT.

Более сложный уровень — это собственно агенты.

Здесь мы объединяем в один workflow (операционную цепочку) несколько агентов и сервисов. Это многоэтапная, часто циклическая операция, в которой один агент может управлять работой нескольких агентов. Это и называется агентом. То есть искусственный интеллект способен выполнять достаточно сложную задачу с множеством этапов, анализировать данные в условиях неопределённости, самостоятельно выходить в интернет, запрашивать информацию, обрабатывать данные, в том числе даже совершать платежи и так далее. Чтобы реализовать такой функционал, как правило, недостаточно одной модели — требуется взаимодействие нескольких моделей, а также дополнительная координирующая модель.

Фактически представьте, что у вас есть несколько исполнителей, каждый из которых выполняет свою часть работы, а у них есть менеджер. В целом эта команда получает на вход комплексный запрос, например: «Отремонтировать дом». Менеджер распределяет задачи, рассчитывает ресурсы, ставит задачи исполнителям. Исполнители выполняют работу. Если у них возникают сложности, они обращаются к менеджеру, который решает проблемы, создаёт для них условия и так далее. В принципе, этим и занимаются агенты.

2 минуты

15 марта 2025