Найти в Дзене

Видимо и закономерно есть трудности в понимании отличий ИИ ассистента и ИИ агента

Видимо и закономерно есть трудности в понимании отличий ИИ ассистента и ИИ агента. 1. ИИ ассистент это голая языковая модель, которая отвечает на 1 вопрос за раз. Этот процесс ответа на вопрос называют инференс (искусственный термин для развода лохов - умножение сущностей для поднятия бабок). Типичный пример ассистента в виде чата - chatGPT. При этом ассистент на самом деле во время ответа "не помнит" контекста всей беседы и при каждом новом вопросе ему "напоминают" этот контекст. У ассистента нет памяти в привычном для нас смысле и то, что chatGPT как бы "помнит" контекст есть результат искусственных телодвижений "под капотом". Т.е. при каждом НОВОМ вопросе модельке "догружают" коротенько о чем вы базарили до этого вопроса. Просто нам кажется, что модельке направляют только новый вопрос. В результате чего в диалогах (тредах) у пользователя возникает иллюзия, что у chatGPT есть личность, что он помнит все и т.п. 2. Агент = много ассистентов + память миссии агента, описание пр

Видимо и закономерно есть трудности в понимании отличий ИИ ассистента и ИИ агента.

1. ИИ ассистент это голая языковая модель, которая отвечает на 1 вопрос за раз. Этот процесс ответа на вопрос называют инференс (искусственный термин для развода лохов - умножение сущностей для поднятия бабок).

Типичный пример ассистента в виде чата - chatGPT.

При этом ассистент на самом деле во время ответа "не помнит" контекста всей беседы и при каждом новом вопросе ему "напоминают" этот контекст.

У ассистента нет памяти в привычном для нас смысле и то, что chatGPT как бы "помнит" контекст есть результат искусственных телодвижений "под капотом".

Т.е. при каждом НОВОМ вопросе модельке "догружают" коротенько о чем вы базарили до этого вопроса. Просто нам кажется, что модельке направляют только новый вопрос.

В результате чего в диалогах (тредах) у пользователя возникает иллюзия, что у chatGPT есть личность, что он помнит все и т.п.

2. Агент = много ассистентов + память миссии агента, описание правил, процессов, разделение ассистентов на менеджеров (оркестраторов), аналитиков, исполнителей, внутренние базы знаний, RAG, графы и прочая черная магия.

Грубо говоря....

Ассистент = один умный исполнитель, который способен исполнять только одну задачу за раз и не помнит ничего до этой задачи. Но эту задачу он может исполнить хорошо (при надлежащем промпте), если в этой задаче не более 1-ого шага.

Агент - большая корпорация, которая все помнит, осознает, способна выполнять много шаговые миссии, обладает известной автономностью и способностью к самообучению.

Аналогия. Ассистент = дизайнер, который умеет рисовать иконки - одну за раз. Агент - целое рекламно-дизайнерское агентство, в котором работает тьма народа над разными задачами и ведет оно много проектов одновременно.

Тем не менее, как корпорация состоит из людей, так и агент состоит из ассистентов. Т.е. если ассистенты тупые, то и агент слабый. Если ассистент умный, то и возможности агента больше.

Для простых одноразовых задач, диалогов - хороши ассистенты упакованные в виде привычных нам чатов - chatGPT и т.п.

Для комплексных проектов - хороши агенты, которые СПЕЦИАЛИЗИРУЮТСЯ на отраслях. Для разработки - популярным является Claude Code. Для науки, медицины, права, инженерии, создания видео, музыки - другие агенты.

Проблема возникает тогда, когда для типично агентских задач мы пытаемся использовать ассистентов (чаты), которые просто не приспособлены для сложных много-шаговых проектов. Поэтому, если вы хотите использовать чаты, то вам надо самим вести структуру проекта, быть менеджером, и каждый раз давать сотни задач, контролируя исполнение. Или создавать своего агента. Или использовать профильного агента для вашей задаче.