Исследователи из Лондонского университета и Института Алана Тьюринга разработали xMemory — новую стратегию, позволяющую AI-агентам сокращать затраты на токены с 9 тыс. до 4,7 тыс. Это особенно важно для бизнеса, который стремится развивать длительные AI-решения. Рынок AI-агентов активно растёт, и необходимость в эффективных и экономичных решениях становится критической. Стандартные методы работы с RAG сталкиваются с лимитами, когда речь идёт о многосессионных взаимодействиях. Это приводит к высоким затратам на вычисления и снижению качества ответа. xMemory организует разговоры в иерархическую структуру семантических тем, что позволяет AI-агентам лучше сохранять контекст и оптимизировать память. Вместо использования большого объёма токенов для хранения информации, система делит беседу на самостоятельные компоненты. При поиске информации она последовательно проходит по иерархии — от тем к семантике. Это означает, что даже в длительных беседах AI-агент может оставаться последовательным и
Исследователи разработали xMemory, сокращающее затраты на токены до 4,7 тыс.
26 марта26 мар
1 мин