Google представила Gemini Embedding 2

12 марта12 мар

~1 мин

Gemini Embedding 2 — первая полностью мультимодальная модель, которая сопоставляет текст, изображения, видео, аудио и документы в едином векторном пространстве. Модель поддерживает более 100 языков, текстовые входы длиной до 8192 токенов, 6 изображений на запрос, 120-секундные видео, собственные аудиовложения и PDF-файлы объемом до 6 страниц, что упрощает работу с такими задачами, как RAG, семантический поиск, кластеризация и анализ тональности. Благодаря технологии Matryoshka Representation Learning, позволяющей использовать векторы разных размеров, разработчики могут сбалансировать производительность и объем памяти, используя при этом современные методы мультимодального анализа. #новости@dailyprompts

Gemini Embedding 2 — первая полностью мультимодальная модель, которая сопоставляет текст, изображения, видео, аудио и документы в едином векторном пространстве.

Модель поддерживает более 100 языков, текстовые входы длиной до 8192 токенов, 6 изображений на запрос, 120-секундные видео, собственные аудиовложения и PDF-файлы объемом до 6 страниц, что упрощает работу с такими задачами, как RAG, семантический поиск, кластеризация и анализ тональности.

Благодаря технологии Matryoshka Representation Learning, позволяющей использовать векторы разных размеров, разработчики могут сбалансировать производительность и объем памяти, используя при этом современные методы мультимодального анализа.

#новости@dailyprompts

Нейронные сети (Neural Networks)

80,9 тыс интересуются