Добавить в корзинуПозвонить
Найти в Дзене
Машинное обучение

📘 Новая фундаментальная работа (65 страниц) от Stanford, Princeton, Harvard, University of Washington и других топ-университетов: впервые

📘 Новая фундаментальная работа (65 страниц) от Stanford, Princeton, Harvard, University of Washington и других топ-университетов: впервые предлагается полная таксономия того, как современные агентные AI-системы адаптируются. Главная идея: Почти все сложные AI-агенты можно описать через всего 4 базовые типа адаптации - два связаны с обновлением самого агента, два других - с обновлением инструментов, которыми агент пользуется. Что такое агентный AI: Это большие модели, которые могут: - вызывать инструменты, - использовать память, - выполнять задачи в несколько шагов. Что такое адаптация: Любое изменение агента или его инструментов на основе обратной связи, от проверки кода до человеческих оценок. 4 вида адаптации: A1 - Agent Adaptation from Tool Execution Агент обновляется на основе того, что произошло при вызове инструментов: код запустился или упал, поиск что-то нашёл или нет. A2 — Agent Adaptation from Output Evaluation Агент обновляется по оценкам качества своих итоговых дейст

📘 Новая фундаментальная работа (65 страниц) от Stanford, Princeton, Harvard, University of Washington и других топ-университетов: впервые предлагается полная таксономия того, как современные агентные AI-системы адаптируются.

Главная идея:

Почти все сложные AI-агенты можно описать через всего 4 базовые типа адаптации - два связаны с обновлением самого агента, два других - с обновлением инструментов, которыми агент пользуется.

Что такое агентный AI:

Это большие модели, которые могут:

- вызывать инструменты,

- использовать память,

- выполнять задачи в несколько шагов.

Что такое адаптация:

Любое изменение агента или его инструментов на основе обратной связи, от проверки кода до человеческих оценок.

4 вида адаптации:

A1 - Agent Adaptation from Tool Execution

Агент обновляется на основе того, что произошло при вызове инструментов: код запустился или упал, поиск что-то нашёл или нет.

A2 — Agent Adaptation from Output Evaluation

Агент обновляется по оценкам качества своих итоговых действий: человеческим фидбеком, автопроверками ответов, качеством планов.

T1 - Tool Adaptation Independent of Agent

Инструменты обучаются отдельно, а агент остаётся “замороженным”. Например, заранее тренированный retriever или кодовый поисковик.

T2 - Tool Adaptation from Agent Signals

Агент остаётся фиксированным, но инструменты подстраиваются под его поведение — какие документы действительно помогли, какие подсказки улучшили выполнение задачи.

Почему это важно:

- Работа впервые системно упорядочивает методики адаптации агентных систем.

- Помогает понять компромиссы: стоимость обучения, гибкость, переносимость, модульные обновления.

- Показывает историю развития методов A1, A2 и T2, как они усложнялись и какие сигналы начали использовать.

Взгляд сводится к двум осям:

- можно менять агента,

- можно менять инструменты,

- а данные и фидбек служат топливом для обеих стратегий.

Эта таксономия помогает увидеть связи между десятками современных работ и понять, куда движутся агентные архитектуры нового поколения.

https://github.com/pat-jj/Awesome-Adaptation-of-Agentic-AI/blob/main/paper.pdf

-2
-3
-4
-5
-6
-7
-8