Google открыла EmbeddingGemma — компактную (≈308M параметров) мульти языковую модель для генерации встраиваний (embeddings), оптимизированную под вычисления на устройстве. По заявлениям разработчиков, после квантизации модель умещается в <200 MB памяти, работает оффлайн и по качеству близка к встраиваниям моделей размером вдвое больше (Qwen‑Embedding‑0.6B). Ключевые факты Зачем это нужно — практические сценарии Почему это важно Ограничения и нюансы Итог EmbeddingGemma — значимый шаг в сторону распределённого, приватного и малозатратного семантического поиска: модель позволяет запускать качественные embeddings прямо на телефоне или ноутбуке, делая RAG‑функции доступными оффлайн и снижая зависимость от дорогих облачных вызовов. Это открывает новые практические сценарии для персональных ассистентов, корпоративных клиентов с требованиями конфиденциальности и мобильных приложений с жёсткими ограничениями по памяти и задержке. Хотите создать уникальный и успешный продукт? СМС – ваш надежный
Google выпустил EmbeddingGemma — 0.3B эмбеддинговая модель для оффлайн RAG: 0.2 GB памяти — и работает на телефоне
5 сентября 20255 сен 2025
1
3 мин