Найти в Дзене
ИА Регнум

VK внедрила в поиск визуально‑языковые модели для анализа видео и звука

Компания VK начала интегрировать в поисковые механизмы своих продуктов визуально‑языковые модели (VLM). Об этом 19 февраля сообщила пресс-служба организации. VLM — это инструмент искусственного интеллекта, способный одновременно анализировать текст, изображения, звук и видеоряд. Технологию уже задействовали в «VK Видео». В дальнейшем ее внедрят в других сервисах холдинга, где есть поисковые системы. Модель учитывает не только название и описание загруженного на платформу контента, но и его смысловое наполнение, что позволяет ей более точно соотносить ответы с поисковыми запросами пользователей. VLM самостоятельно формирует датасеты и данные о контенте, на основе которых поисковые алгоритмы принимают решение о том, какое видео подходит под конкретный запрос, а какое нет. Благодаря внедрению этой модели в будущем должен улучшиться векторный поиск в продуктах VK, который опирается на семантическое значение запроса. К примеру, система даже сможет учитывать, что пользователь чаще отдает пре

Компания VK начала интегрировать в поисковые механизмы своих продуктов визуально‑языковые модели (VLM). Об этом 19 февраля сообщила пресс-служба организации.

    / Источник: © Алексей Майшев/РИА Новости
/ Источник: © Алексей Майшев/РИА Новости

VLM — это инструмент искусственного интеллекта, способный одновременно анализировать текст, изображения, звук и видеоряд. Технологию уже задействовали в «VK Видео». В дальнейшем ее внедрят в других сервисах холдинга, где есть поисковые системы.

Модель учитывает не только название и описание загруженного на платформу контента, но и его смысловое наполнение, что позволяет ей более точно соотносить ответы с поисковыми запросами пользователей. VLM самостоятельно формирует датасеты и данные о контенте, на основе которых поисковые алгоритмы принимают решение о том, какое видео подходит под конкретный запрос, а какое нет.

Благодаря внедрению этой модели в будущем должен улучшиться векторный поиск в продуктах VK, который опирается на семантическое значение запроса. К примеру, система даже сможет учитывать, что пользователь чаще отдает предпочтение видео с определенным стилем монтажа или цветокоррекции. Кроме того, она станет точнее обрабатывать гибридные запросы, сочетающие текст и визуальные характеристики, такие как «влог из Стамбула с видами на Босфор».

Нововведение сделает поисковую выдачу более персонализированной. В компании также отмечают, что применение VLM позволит в пять раз ускорить разработку и масштабирование новых технологий, направленных на развитие и улучшение поиска во всех продуктах VK.

Согласно данным исследовательской компании Mediascope, в декабре 2025 года среднесуточное время пребывания пользователей во «ВКонтакте» увеличилось на 20% в сравнении с тем же периодом годом ранее и достигло 64 минут. Это стало самым высоким показателем среди социальных сетей в России. В январе 2026 года «VK Видео» стал самым популярным видеохостингом в России по охвату аудитории: ежедневно сервис использовали 42,2 млн человек.

Еще больше информации в канале «Регнум» в мессенджере МАХ.