20 января 2026 команда из Пекинского университета и Shanghai AI Lab опубликовала масштабный обзор "Toward Efficient Agents" — первое систематическое исследование того, почему агенты такие ресурсоёмкие и как это исправить. 📍 Проблема, о которой не говорят Обычный чат-бот работает линейно: вопрос → ответ. Один проход, фиксированная стоимость. Агент работает рекурсивно: на каждом шаге он должен вспомнить контекст из памяти, спланировать действия, вызвать инструменты, проанализировать результат — и повторить цикл многократно. Формула затрат: ❗️Чат-бот: стоимость × токены ❗️Агент: стоимость × токены + память + инструменты + планирование Для сложной исследовательской задачи агент может вызвать поиск 600 раз. Каждая следующая итерация использует вывод предыдущей как вход — затраты растут лавинообразно. ⚡️ Три узких горла эффективности Исследователи проанализировали 100+ работ и выделили критичные компоненты. 1️⃣ Память Агент должен помнить всю историю, но контекст растёт с каждым шаго
🤖 Почему ИИ-агенты расходуют в 10 раз больше ресурсов, чем обычные чат-боты
29 января29 янв
1
2 мин