Найти в Дзене
Social Mebia Systems

Anthropic научила агентов передавать эстафету, не боясь сбоев в длительных задачах

Anthropic разработала двойную архитектуру агентов, которая решает проблему долгосрочной памяти ИИ и позволяет ему выполнять сложные задачи в течение нескольких часов. Как заставить ИИ, лишенного долгосрочной памяти, успешно выполнять сложные задачи, требующие нескольких часов работы? Компания Anthropic представила эффективный фреймворк для работы «долгосрочных агентов», позволяющий ИИ продвигаться постепенно, как опытный инженер, работающий над проектом в несколько смен. Проблема: ИИ забывает всё после закрытия контекста Представьте, что вы нанимаете команду инженеров, которые работают по 24 часа в сутки, чтобы создать сложное приложение. Но есть одно странное правило: каждый новый инженер, приходя на смену, полностью забывает, что делал его предшественник. Независимо от их квалификации, такой проект вряд ли будет завершен. Именно такую проблему и сталкиваются современные ИИ-агенты: при закрытии контекстного окна модель теряет всю информацию, как если бы кто-то стер доску. Это делает

Anthropic разработала двойную архитектуру агентов, которая решает проблему долгосрочной памяти ИИ и позволяет ему выполнять сложные задачи в течение нескольких часов.

Как заставить ИИ, лишенного долгосрочной памяти, успешно выполнять сложные задачи, требующие нескольких часов работы? Компания Anthropic представила эффективный фреймворк для работы «долгосрочных агентов», позволяющий ИИ продвигаться постепенно, как опытный инженер, работающий над проектом в несколько смен.

Проблема: ИИ забывает всё после закрытия контекста

Представьте, что вы нанимаете команду инженеров, которые работают по 24 часа в сутки, чтобы создать сложное приложение. Но есть одно странное правило: каждый новый инженер, приходя на смену, полностью забывает, что делал его предшественник.

Независимо от их квалификации, такой проект вряд ли будет завершен.

Именно такую проблему и сталкиваются современные ИИ-агенты: при закрытии контекстного окна модель теряет всю информацию, как если бы кто-то стер доску. Это делает невозможным выполнение длительных задач, требующих множества шагов и итераций.

Решение: Двойная архитектура агентов

Anthropic решила эту проблему, вдохновившись повседневной практикой опытных инженеров. Они разработали двухкомпонентную систему на базе Claude Agent SDK — мощного фреймворка, способного кодировать, исследовать, использовать инструменты и планировать действия.

1. Инициализирующий агент (Initializer Agent)

Первый агент отвечает за подготовку среды: создаёт скрипт init.sh, файл прогресса claude-progress.txt и первый коммит в Git. Он формирует список функций, каждая из которых изначально помечена как «не реализована».

2. Кодирующий агент (Coding Agent)

Каждый последующий агент выполняет лишь небольшой шаг — одну функцию — и сохраняет изменения в виде коммита и обновления файла прогресса. Это позволяет следующему агенту быстро понять, где остановились предыдущие.

Ключевые элементы системы

  • Функциональный список: ИИ получает четкий перечень функций, которые нужно реализовать. Это помогает избежать ситуации, когда агент считает задачу завершенной слишком рано.
  • Инкрементальный прогресс: Агент работает маленькими шагами, что снижает риск ошибок и перегрузки контекста.
  • Тестирование: Anthropic обучила агентов использовать автоматизированные тесты через Puppeteer, имитируя действия реального пользователя. Это позволяет находить ошибки, которые не видны на уровне кода.

Преимущества подхода

  • Безопасное состояние среды: Каждый шаг завершается чистым кодом, документацией и возможностью отката.
  • Минимизация затрат токенов: Агенты не тратят ресурсы на повторное «вспоминание» — вся информация доступна в файлах.
  • Устойчивость к сбоям: Даже если один агент потеряет контекст, следующий легко продолжит с того же места.

Ограничения и перспективы

Несмотря на успех в веб-разработке, подход всё ещё имеет ограничения. Например, ИИ не всегда может корректно обрабатывать визуальные элементы интерфейса, такие как всплывающие окна alert.

Anthropic также признаёт, что в будущем может потребоваться многокомпонентная архитектура — с отдельными агентами для тестирования, проверки качества и оптимизации кода.

Заключение

Разработка Anthropic открывает новые возможности для применения ИИ в задачах, требующих длительной работы и координации. Такие технологии могут стать основой для автономных систем в науке, финансах и других областях, где важна не только точность, но и преемственность.

Источник: Anthropic Engineering Blog

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/