Добавить в корзинуПозвонить
Найти в Дзене

Исследователи разработали xMemory, сокращающее затраты на токены до 4,7 тыс.

Исследователи из Лондонского университета и Института Алана Тьюринга разработали xMemory — новую стратегию, позволяющую AI-агентам сокращать затраты на токены с 9 тыс. до 4,7 тыс. Это особенно важно для бизнеса, который стремится развивать длительные AI-решения. Рынок AI-агентов активно растёт, и необходимость в эффективных и экономичных решениях становится критической. Стандартные методы работы с RAG сталкиваются с лимитами, когда речь идёт о многосессионных взаимодействиях. Это приводит к высоким затратам на вычисления и снижению качества ответа. xMemory организует разговоры в иерархическую структуру семантических тем, что позволяет AI-агентам лучше сохранять контекст и оптимизировать память. Вместо использования большого объёма токенов для хранения информации, система делит беседу на самостоятельные компоненты. При поиске информации она последовательно проходит по иерархии — от тем к семантике. Это означает, что даже в длительных беседах AI-агент может оставаться последовательным и
Оглавление

Исследователи из Лондонского университета и Института Алана Тьюринга разработали xMemory — новую стратегию, позволяющую AI-агентам сокращать затраты на токены с 9 тыс. до 4,7 тыс. Это особенно важно для бизнеса, который стремится развивать длительные AI-решения.

Зачем нужны новые подходы

Рынок AI-агентов активно растёт, и необходимость в эффективных и экономичных решениях становится критической. Стандартные методы работы с RAG сталкиваются с лимитами, когда речь идёт о многосессионных взаимодействиях. Это приводит к высоким затратам на вычисления и снижению качества ответа.

Как работает xMemory

xMemory организует разговоры в иерархическую структуру семантических тем, что позволяет AI-агентам лучше сохранять контекст и оптимизировать память. Вместо использования большого объёма токенов для хранения информации, система делит беседу на самостоятельные компоненты. При поиске информации она последовательно проходит по иерархии — от тем к семантике.

Это означает, что даже в длительных беседах AI-агент может оставаться последовательным и сохранять актуальный контекст. Например, фиксируя предпочтения пользователя, xMemory избегает дублирования данных, обеспечивая понимание структуры разговора.

Преимущества для бизнеса

Предприятия могут задействовать данную технологию для создания персонализированных AI-ассистентов, которые поддерживают более сложные и долгосрочные взаимодействия без огромных вычислительных затрат. Это открывает новые горизонты для интерактивных и контекстно-осознанных решений, которые нынче нужны рынку.

Следующий шаг — внедрение xMemory в коммерческие приложения и дальнейшие исследования для улучшения её работы в реальных сценариях. Возможности для AI-агентов теперь гораздо шире, и это как сотрудников IT, так и бизнес-партнёров касается в значительной мере.

The post Исследователи разработали xMemory, сокращающее затраты на токены до 4,7 тыс. appeared first on iTech News.