Найти тему
Микрофоны «Октава»

Кто отвечает за работу музыкальных подборок в интернете?

Мы редко задумываемся о том, кто составляет плейлисты на наших любимых музыкальных сервисах. Кто собирает подборки, выбирает треки и объединяет миллион слушателей каждый месяц. Раньше радиостанции первыми несли музыку в массы, когда люди слушали эфиры. Сейчас технологии не стоят на месте, музыка стала доступнее и все делается для максимального комфорта и удобства пользователя.

Даже если своя музыка надоедает, можно включить другой плейлист независимо от тематики, продолжительности и настроения. В настоящее время слушатели заходят в любой музыкальный сервис, например, самый популярный - Apple Music и включают плейлисты “Только хиты”, “Красная дорожка”, “Продуктивные часы”.

Помимо Apple Music есть еще популярные сервисы Spotify, Яндекс.музыка, VK Музыка, SoundCloud.

Посмотрим, как Spotify создает рекомендательные плейлисты. Каков принцип создания музыкальных подборок? В сервисе Spotify существует три модели рекомендаций. Первая - КОЛЛАБОРАТИВНАЯ ФИЛЬТРАЦИЯ.

Такое можно еще встретить у компании Netflix. Фильтрация работает так, что Нетфликс проводит анализ рейтингов пользователей, после чего подбирает, что посмотреть зрителю на основе схожих вкусов и оценок. В случае со Spotify, все немного иначе. У сервиса нет рейтинговой системы, пользователи не могут ставить оценки трекам. Но коллаборативная фильтрация работает за счет обратной связи. (количества прослушиваний композиции, добавил ли слушатель песню к себе, переходил ли на страницы артиста)

Вторая модель рекомендаций называется ОЕЯ - обработка естественного языка. Механизм работает так: в источнике базы данных хранится вся текстовая информация (о самом треке, о новостях, связанных с песней, упоминаниях в постах) Spotify все время ищет, где упоминали трек, кто о нем писал, что конкретно сообщают. Модель ОЕЯ позволяет понять, что пользователи думают и говорят о треке и об авторе самой песни.

Последняя модель позволяет еще эффективнее работать двум предыдущим моделям. Мы говорим о модели с аудиофайлами и сверточной нейронной сети.

Если в первых двух механизмах рекомендаций считывается информация о прослушанных песнях, то здесь учитываются новые загруженные релизы. Аудиоданные оцениваются с помощью нейронной сети. Она работает также в программах для распознавания лиц. Музыкальный сервис Spotify принял данную модель с аудиоданными вместо пикселей (изображений). Существует несколько сверточных слоев. Когда аудио проходит через каждый слой, образует спектрограмму, где рассчитывается статистика усвоенных особенностей трека за время прослушивания. То есть пока аудио движется сквозь слои, собирается определенная аналитика. Затем вся информация обрабатывается. В итоге складывается комплексное “понимание” трека, состоящее из размера песни, формы громкости и темпа, наличие вокала.