Учёные из Амстердамского университета почти в 60 раз ускорили обучение рекомендательных систем с помощью российского датасета Yambda. Набор данных с почти 5 миллиардами обезличенных событий «Яндекс Музыки» компания выложила в открытый доступ в 2025 году, сообщила пресс-служба Яндекса. Исследователи улучшили модель Seater, которая организует товары и контент в иерархический каталог. Раньше подготовка такого каталога занимала до 20% времени обучения. Учёные предложили два новых метода подготовки данных. Быстрый метод сократил время с 82 минут до 83 секунд, сохранив качество рекомендаций. Комбинированный подход ускорил процесс в 15 раз и даже повысил точность рекомендаций. «Эксперимент подтвердил лидерство Seater по сравнению с популярными системами SASRec, BERT4Rec и GRU4Rec на 13–17%», — говорится в сообщении пресс-службы. Код улучшенной модели Seater выложили в открытый доступ. Авторы эксперимента подчеркнули, что Yambda позволил доказать практическую применимость генеративных рекоменд
Датасет «Яндекс Музыки» помог ускорить ИИ-рекомендации в 60 раз
ВчераВчера
91
1 мин