Найти в Дзене

Как работает алгоритм рекомендаций на «Яндекс.Музыке»

Кажется, что «Моя волна» или подборки, которые звучат как будто сервис угадывает твое настроение, — это магия. На практике за этим стоит не интуиция, а алгоритмы обработки данных и машинного обучения, которые анализируют все, что ты делаешь в сервисе: что слушаешь, лайкаешь, пропускаешь и как долго остаешься на треке. Самое главное для рекомендаций — поведение пользователя: Каждое действие — это сигнал алгоритму о твоих музыкальных предпочтениях. С течением времени система накапливает весь твой «музыкальный след» и учится понимать не только что ты слушаешь, но и как ты слушаешь. Одна из ключевых техник — коллаборативная фильтрация. Алгоритм смотрит на всех пользователей, сравнивает их музыкальные действия и ищет похожие паттерны:
— кто еще слушал те же треки, что и ты,
— что слушали они, но ты еще нет. Если у тебя и у другого пользователя похожие музыкальные вкусы сейчас и раньше — высока вероятность, что их любимые треки тебе тоже понравятся. Этот подход работает, когда у алгоритма м
Оглавление

Кажется, что «Моя волна» или подборки, которые звучат как будто сервис угадывает твое настроение, — это магия. На практике за этим стоит не интуиция, а алгоритмы обработки данных и машинного обучения, которые анализируют все, что ты делаешь в сервисе: что слушаешь, лайкаешь, пропускаешь и как долго остаешься на треке.

С чего все начинается: данные пользователя

Самое главное для рекомендаций — поведение пользователя:

  • прослушивания треков,
  • лайки и дизлайки,
  • пропуски,
  • время прослушивания,
  • жанры и исполнители, с которыми ты взаимодействуешь.

Каждое действие — это сигнал алгоритму о твоих музыкальных предпочтениях. С течением времени система накапливает весь твой «музыкальный след» и учится понимать не только что ты слушаешь, но и как ты слушаешь.

Коллаборативная фильтрация: похожие вкусы = похожие рекомендации

Одна из ключевых техник — коллаборативная фильтрация. Алгоритм смотрит на всех пользователей, сравнивает их музыкальные действия и ищет похожие паттерны:
— кто еще слушал те же треки, что и ты,
— что слушали они, но ты еще нет.

Если у тебя и у другого пользователя похожие музыкальные вкусы сейчас и раньше — высока вероятность, что их любимые треки тебе тоже понравятся.

Этот подход работает, когда у алгоритма много данных о многих слушателях — и именно этим объясняется, почему крупные сервисы могут давать более точные рекомендации.

-2

«Моя волна» — не просто список, а прогноз

«Моя волна» — это персональный музыкальный поток, который предсказывает, что ты захочешь услышать дальше. Алгоритм не просто повторяет то, что ты уже слушал, он анализирует последовательность треков и контекст, чтобы подбирать следующие композиции.

В недавно опубликованном открытом датасете YaMBDa содержится почти 5 миллиардов анонимизированных взаимодействий пользователей с треками — информация, которую исследователи и инженеры используют для развития рекомендаций. Данные включают не только прослушивания, но и подробности: лайки, дизлайки и метки о том, были ли треки найдены через рекомендации или самостоятельно.

-3

Генеративные модели и глубокий анализ

Современная версия рекомендаций Яндекс.Музыки основана на генеративных нейронных моделях, которые умеют учитывать еще больше информации:
— более длинные истории прослушиваний,
— сезонные изменения вкуса,
— переходы между жанрами и настроениями.

Это не просто «больше данных — лучше рекомендации». Новые модели могут предсказывать, какие треки могут понравиться, даже если ты никогда раньше не слышал похожие. Это создает эффект «сюрприза»: иногда ты слышишь что-то новое и неожиданно подходящее.

Что еще влияет на рекомендации

Реакции пользователя. Если ты лайкаешь трек — это сильный сигнал, что тебе нравится стиль. Дизлайк или пропуск — тоже сигнал, но «отрицательный».
Взаимодействие с плейлистами. Если ты слушаешь тематические подборки — алгоритм учитывает не только жанры, но и настроение, формат и реакцию на треки внутри этих плейлистов.
Данные о треке. Аудио-эмбеддинги — числовые представления треков, которые кодируются нейросетью на основе спектральных и других характеристик — помогают системе определять похожесть треков на уровне звука.

Итог

Алгоритм рекомендаций Яндекс.Музыки — это комбинация моделей машинного обучения, анализа поведения пользователей и признаков самих треков. Он не просто повторяет твои прошлые выборы, а строит прогноз следующего шага: что ты можешь услышать и полюбить.

❝Если ты хочешь, чтобы «Моя волна» становилась лучше — слушай много, реагируй активно и взаимодействуй с треками.❞ — это не маркетинговый лозунг, а практическое правило: чем больше сигналов получает система, тем точнее ее предсказания.