Компания VK (бывшая Mail.ru Group) представила новую модель RuModernBERT, предназначенную для обработки естественного русского языка. Данная модель способна анализировать длинные тексты целиком, без необходимости их разбивки на фрагменты, и функционирует локально, что позволяет снизить нагрузку на инфраструктуру. Разработчики отмечают, что RuModernBERT предназначена для решения множества задач в области обработки текста. Она может использоваться для извлечения информации, анализа тональности, а также поиска и ранжирования контента в различных приложениях и сервисах. Модель понимает сложные запросы пользователей, что позволяет ей находить наиболее релевантные результаты, такие как видео, товары или документы. Модель была обучена на 2 триллионах токенов данных, включая материалы на русском и английском языках, а также код. Максимальная длина контекста, которую может обрабатывать RuModernBERT, составляет 8192 токена. В процессе обучения использовались различные источники данных, такие как
VK представила новую модель RuModernBERT для обработки естественного языка
24 июля 202524 июл 2025
1
1 мин