Если ваш AI-агент «съедает» лимит контекста, потому что вы грузите в prompt слишком много данных, OpenViking от ByteDance предлагает альтернативу: вместо «всё сразу» — уровни подгрузки контекста. OpenViking хранит данные агента как файлы в иерархии: session/ для текущего разговора, user/ для долгой памяти пользователя, agent/ для опыта и инструкций агента, resources/ для знаний без привязки к роли. Главная механика — трёхуровневая загрузка: L0 (резюме для планирования), L1 (обзор директории) и L2 (детали по требованию), что по заявлению команды даёт до 91% экономии токенов. Это помогает делать агентов с длинными сессиями: ассистент помнит предпочтения и события, а код-агент понимает структуру репозитория и возвращается к прошлым решениям без постоянного «перекачивания» истории. Бенчмарк команды привязан к их сценарию и данным; на других длинных проектах с редкими обращениями к L2 выгода может быть меньше. Для интеграции есть встроенный MCP HTTP endpoint с набором инструментов (searc
🛠 OpenViking от ByteDance организует память AI-агента в файловой иерархии и обещает до 91% экономии токенов
ВчераВчера
1 мин