Разработан новый офлайн-пайплайн RAG (поиск с увеличением извлечения) для мобильной разработки, который обеспечивает поиск за менее чем 200 миллисекунд. Этот проект существенно повышает эффективность мобильных приложений, позволяя делать офлайн-запросы без зависимости от сетевых подключений. Технология включает использование SQLite для хранения векторных индексов и ONNX Runtime для генерации внедрений. Пайплайн совместим с Android и iOS благодаря Kotlin Multiplatform и весит менее 50 МБ, что делает его удобным для мобильных устройств. Архитектура состоит из трёх ключевых этапов: генерация внедрений, поиск по ссылкам и составление контекста. В тестах на Google Pixel 7a пайплайн демонстрировал время отклика около 140 мс при p95, что позволяет быстро обрабатывать запросы пользователей. Установка и интеграция компонентов проста: разработчики используют библиотеку sqlite-vss для работы с данными и минимизируют нагрузку за счет оптимизации кода. Использование KMP позволяет выделить общую лог
Создан офлайн-пайплайн RAG на мобильных устройствах с реакцией меньше 200 мс
18 марта18 мар
1 мин