Найти в Дзене
ProAi

Как Anthropic решила проблему забывчивости AI-агентов: два трюка, которые меняют игру

Представьте ситуацию: вы даете AI-агенту задачу, а он через пару часов работы забывает, что вообще нужно делать. Звучит как сон? Для предприятий это реальная головная боль. И вот, похоже, Anthropic нашла способ это исправить. Суть проблемы проста: агенты забывают инструкции или теряют нить беседы по мере работы. Это происходит потому, что они упираются в ограничения контекстного окна — вроде того, как человеческая память не бесконечна. Но если человек может написать заметку, то AI? Вот тут и начинается интерес. Компания разработала решение для своего Claude Agent SDK — двухуровневый подход, который позволяет агенту работать через разные контекстные окна. Представьте, что каждая новая сессия — это новый день, и вам нужно все аккуратно задокументировать, чтобы завтра не начинать с нуля. «Ключевая сложность долгоживущих агентов в том, что они работают сессиями, а каждая новая сессия начинается без памяти о предыдущем», — пишет Anthropic в своем блоге. Прямо как Дори из «В поисках Немо», т
Оглавление
   Anthropic раскрывает революционные методы борьбы с забывчивостью ИИ: ключевые слова как инструмент улучшения памяти агентов.
Anthropic раскрывает революционные методы борьбы с забывчивостью ИИ: ключевые слова как инструмент улучшения памяти агентов.

Представьте ситуацию: вы даете AI-агенту задачу, а он через пару часов работы забывает, что вообще нужно делать. Звучит как сон? Для предприятий это реальная головная боль. И вот, похоже, Anthropic нашла способ это исправить.

Суть проблемы проста: агенты забывают инструкции или теряют нить беседы по мере работы. Это происходит потому, что они упираются в ограничения контекстного окна — вроде того, как человеческая память не бесконечна. Но если человек может написать заметку, то AI? Вот тут и начинается интерес.

Компания разработала решение для своего Claude Agent SDK — двухуровневый подход, который позволяет агенту работать через разные контекстные окна. Представьте, что каждая новая сессия — это новый день, и вам нужно все аккуратно задокументировать, чтобы завтра не начинать с нуля.

В чем настоящая проблема?

«Ключевая сложность долгоживущих агентов в том, что они работают сессиями, а каждая новая сессия начинается без памяти о предыдущем», — пишет Anthropic в своем блоге. Прямо как Дори из «В поисках Немо», только с кодом.

Здесь кроется вся беда. Контекстные окна ограничены. Сложные проекты не укладываются в одно окно. Что получается? Агент должен как-то прыгать между сессиями, но теряет данные на лету.

Проблема усугубляется еще и тем, что долгосрочная память агентов критична для стабильной работы в бизнесе. Забывчивый помощник — это не помощник, это катастрофа.

За последний год компании активно ищут решения. Есть LangMem SDK от LangChain, Memobase, Swarm от OpenAI. Параллельно исследователи предлагают новые фреймворки вроде Memp и даже Nested Learning Paradigm от Google. Словом, все ломают головы.

Большинство этих решений — с открытым кодом, и их можно адаптировать под разные большие языковые модели. А Anthropic пошла своим путем — улучшила именно свой Claude Agent SDK.

Как это работает на самом деле?

Anthropic заметила кое-что интересное: технически хватает возможностей, чтобы агент работал сколько угодно долго. Но на практике? Попроси модель вроде Opus 4.5 создать веб-приложение по команде «построй клон claude.ai» — и она откажет. Просто не справится.

Речь идет не о глупости агента. Проблема в два раза глубже:

  • Первый сбой: агент берется за слишком много сразу. Контекст кончается посередине, и он просто гадает, что дальше. Следующему агенту передает размытые инструкции — как телефон поломанный.
  • Второй сбой: позже, когда часть функций уже собрана, агент видит прогресс и объявляет работу завершенной. Хотя половина еще не сделана!

Вот Anthropic и решила: надо работать как настоящие инженеры. Они каждый день делают?

Так вот, двухуровневое решение выглядит так: агент-инициализатор подготавливает среду, ведет логи того, что сделано, какие файлы добавлены. Потом агент-кодер берет работу, делает инкрементальный прогресс и оставляет четкие записки для следующего. «Вдохновение мы взяли из того, что делают эффективные разработчики каждый день», — признаются исследователи.

К тому же, добавили инструменты для тестирования. Агент теперь видит баги не только на уровне кода, но и при реальном запуске. Это же элементарная логика!

Что дальше с этим будет?

Честно говоря, Anthropic сама признает: это лишь один из возможных подходов. Просто начало. Исследователи пока не до конца ясно поняли, что лучше — один универсальный агент или система из нескольких специализированных.

Еще момент: они экспериментировали только с веб-приложениями. А что, если применить эту логику к научным исследованиям? К финмоделированию? Там же аналогичные проблемы с долгой работой и потерей контекста.

«Похоже, часть или даже все эти принципы применимы и к другим долгоживущим задачам агентов», — подозревает компания. В этом весь фокус.

Агенты и их развитие — это не просто кодовое слово в AI индустрии. Это будущее, и оно уже тут. Не отставайте от того, как меняется мир искусственного интеллекта.🔔 Чтобы узнать больше о долгоживущих агентах, memory solutions и последних достижениях в AI, подпишитесь на мой канал «ProAI» в Telegram!