Добавить в корзинуПозвонить
Найти в Дзене

🛠 Milvus помогает хранить и искать по миллиардам эмбеддингов в продакшене благодаря cloud-native архитектуре

Если вам нужно хранить и искать по миллиардам векторов в продакшене, вы наверняка слышали про Milvus — давайте разберёмся, как он устроен изнутри и что нового в последних релизах. Какую проблему решает: раньше приходилось городить отдельные сервисы для ANN-поиска, хранения эмбеддингов и фильтрации по метаданным; Milvus берёт это на себя как векторную БД, заточенную под Approximate Nearest Neighbor (приближённый поиск ближайших соседей). Что можно построить: RAG-систему, где эмбеддинг вопроса находит релевантные чанки с фильтрами по источнику/дате, или мультимодальный поиск по изображениям и аудио, где запрос и документы хранятся в одном индексе. Как попробовать: начните с репозитория https://github.com/milvus-io/milvus и актуальной документации/чейнджлога; для быстрых экспериментов часто достаточно поднять кластер в Docker или через Helm (детали зависят от вашей схемы деплоя). Чем отличается: архитектура рассчитана на горизонтальное масштабирование в Kubernetes, а в ядре используют

🛠 Milvus помогает хранить и искать по миллиардам эмбеддингов в продакшене благодаря cloud-native архитектуре

Если вам нужно хранить и искать по миллиардам векторов в продакшене, вы наверняка слышали про Milvus — давайте разберёмся, как он устроен изнутри и что нового в последних релизах.

Какую проблему решает: раньше приходилось городить отдельные сервисы для ANN-поиска, хранения эмбеддингов и фильтрации по метаданным; Milvus берёт это на себя как векторную БД, заточенную под Approximate Nearest Neighbor (приближённый поиск ближайших соседей).

Что можно построить: RAG-систему, где эмбеддинг вопроса находит релевантные чанки с фильтрами по источнику/дате, или мультимодальный поиск по изображениям и аудио, где запрос и документы хранятся в одном индексе.

Как попробовать: начните с репозитория https://github.com/milvus-io/milvus и актуальной документации/чейнджлога; для быстрых экспериментов часто достаточно поднять кластер в Docker или через Helm (детали зависят от вашей схемы деплоя).

Чем отличается: архитектура рассчитана на горизонтальное масштабирование в Kubernetes, а в ядре используются дисковые ANN-варианты вроде DiskANN (под SSD) и библиотека Knowhere как слой над разными движками индексов; последнее время заметны улучшения восстановления MixCoord и ускорение поиска с фильтрацией, а в Go SDK v2.6.4 добавили поддержку struct-array и новых типов колонок для вложенных векторных полей (например, ColumnFloatVectorArray).

#tool #Milvus #GoSDK #RAG #Kubernetes #DiskANN #Knowhere

🔗 milvus-io/milvus