Добавить в корзинуПозвонить
Найти в Дзене

🛠 OpenViking от ByteDance организует память AI-агента в файловой иерархии и обещает до 91% экономии токенов

Если ваш AI-агент «съедает» лимит контекста, потому что вы грузите в prompt слишком много данных, OpenViking от ByteDance предлагает альтернативу: вместо «всё сразу» — уровни подгрузки контекста. OpenViking хранит данные агента как файлы в иерархии: session/ для текущего разговора, user/ для долгой памяти пользователя, agent/ для опыта и инструкций агента, resources/ для знаний без привязки к роли. Главная механика — трёхуровневая загрузка: L0 (резюме для планирования), L1 (обзор директории) и L2 (детали по требованию), что по заявлению команды даёт до 91% экономии токенов. Это помогает делать агентов с длинными сессиями: ассистент помнит предпочтения и события, а код-агент понимает структуру репозитория и возвращается к прошлым решениям без постоянного «перекачивания» истории. Бенчмарк команды привязан к их сценарию и данным; на других длинных проектах с редкими обращениями к L2 выгода может быть меньше. Для интеграции есть встроенный MCP HTTP endpoint с набором инструментов (searc

🛠 OpenViking от ByteDance организует память AI-агента в файловой иерархии и обещает до 91% экономии токенов

Если ваш AI-агент «съедает» лимит контекста, потому что вы грузите в prompt слишком много данных, OpenViking от ByteDance предлагает альтернативу: вместо «всё сразу» — уровни подгрузки контекста.

OpenViking хранит данные агента как файлы в иерархии: session/ для текущего разговора, user/ для долгой памяти пользователя, agent/ для опыта и инструкций агента, resources/ для знаний без привязки к роли. Главная механика — трёхуровневая загрузка: L0 (резюме для планирования), L1 (обзор директории) и L2 (детали по требованию), что по заявлению команды даёт до 91% экономии токенов.

Это помогает делать агентов с длинными сессиями: ассистент помнит предпочтения и события, а код-агент понимает структуру репозитория и возвращается к прошлым решениям без постоянного «перекачивания» истории. Бенчмарк команды привязан к их сценарию и данным; на других длинных проектах с редкими обращениями к L2 выгода может быть меньше.

Для интеграции есть встроенный MCP HTTP endpoint с набором инструментов (search/read/list/store/add_resource/grep/glob/forget/health), что упрощает подключение к агентным платформам, которые умеют MCP.

Проверить можно в репозитории: volcengine/OpenViking.

#tool #OpenViking #RAG #agent #MCP #filesystem #context-engineering

🔗 volcengine/OpenViking