Компания «Яндекс» предоставила доступ к массиву данных Yambda — одному из самых обширных в мире специализированных наборов для разработки и тестирования алгоритмических решений в области рекомендаций. Yambda базируется на обезличенных данных, собранных сервисом «Яндекс Музыка». Этот массив предназначен для использования специалистами, исследователями и образовательными учреждениями, стремящимися усовершенствовать алгоритмы рекомендаций. Доступны три версии Yambda: полная (5 миллиардов записей о взаимодействиях), средняя (500 миллионов) и малая (50 миллионов), что позволяет выбирать оптимальный объем данных в зависимости от конкретных задач и целей исследований. Открытые данные включают агрегированные показатели прослушиваний, пользовательские оценки и метаданные музыкальных композиций. Конфиденциальность пользователей и защита их персональных данных гарантированы. Yabama может быть использован для тестирования и оптимизации систем рекомендаций в различных сферах, таких как киноиндустри
«Яндекс» разместил в открытый доступ датасет для рекомендательных систем
29 мая 202529 мая 2025
1
1 мин