Найти в Дзене
Нота.

Компьютерное распознавание музыкальных эмоций.

Оглавление
ссылка на фото: unsplash.com/photos/6Woj_wozqmA
ссылка на фото: unsplash.com/photos/6Woj_wozqmA

Введение. Роль музыки в жизни человека.

Музыка играет важную роль в истории человечества, особенно в цифровую эпоху.

Никогда еще не создавалась такая большая коллекция музыки, доступ к которой осуществляется ежедневно.

Популярность Интернета и использование компактных аудиоформатов с качеством, близким к CD, таких как MP3 (MPEG-1 Audio Layer 3), ускорили рост цифровых музыкальных библиотек.

Преобладающие ситуации, в которых люди сталкиваются с музыкой, сейчас повсеместны, включая действия, в которых происходит самая обыденная деятельность:

  • пробуждение от сна;
  • завтрак;
  • уборка;
  • покупки;
  • учеба;
  • физические упражнения;
  • вождение и так далее.

Музыка повсюду.

По мере увеличения объема гаджетов, традиционных подходов вполне достаточно для управления музыкальными произведениями, основанных на метаданных каталогов, таких как имя исполнителя, название альбома и название песни.

Организация и поиск музыкальной информации должны развиваться таким образом, чтобы удовлетворять постоянно растущий спрос на легкий и эффективный доступ к ней.

В ответ на этот спрос, в последние несколько лет, все большее внимание уделяется организации и поиску музыки с помощью эмоций.

Как машина ищет эмоции?

Поскольку основные функции музыки являются социальными и психологическими, и поскольку почти каждое музыкальное произведение создано для передачи эмоций, организация и извлечение музыки эмоциями считается разумным способом доступа к музыкальной информации. Принято считать, что музыку нельзя сочинять, исполнять или слушать без привязанности. Музыка может довести нас до слез, утешить, когда мы в печали, или заставить полюбить.

Исследования поведения музыкальной информации также выявили, что эмоции являются важным критерием, используемым людьми в поиске музыки и организации.

Согласно данным социальных тегов на популярном коммерческом музыкальном сайте, теги эмоций являются третьим по частоте типом тегов (вторым по частоте после жанровых и локальных), присваиваемых музыкальным произведениям пользователей Интернета.

Несмотря на то, что идея поиска музыки на основе эмоций была в то время новой, опрос, проведенный в 2004 г., показал, что около 28,2% участников определили эмоции как важный критерий поиска и организации музыки.

Соответственно, поиску музыки, основанной на эмоциях, уделяется все больше внимания как в академических кругах, так и в промышленности.

В академических кругах все больше и больше мультимедийных систем, включающих анализ эмоций музыкальных сигналов, таких как:

  • Moodtrack;
  • LyQ;
  • MusicSense;
  • Mood Cloud;
  • Moody.

В индустрии многие музыкальные компании, используют эмоции в качестве сигнала для поиска музыки.

Например, таксономия настроения состоит из более чем 300 весьма специфических категорий настроения, которые организованы по иерархической схеме с более широкими категориями настроения на высшем уровне, состоящими из нескольких более специфических подкатегорий.

Метаданные Mood автоматически выводятся с помощью собственных технологий анализа контента и машинного обучения Gracenote, без какой-либо маркировки вручную или вмешательства пользователя.

Эти метаданные настроения служат дополнительным критерием, по которому пользователи могут упорядочивать и извлекать музыку на основе контента.

Пользователь может организовать свои музыкальные коллекции по различным категориям настроения, представленным аффективными прилагательными.

Машина для эмоций.

ссылка на фото: unsplash.com/photos/3ItLsIWweFQ
ссылка на фото: unsplash.com/photos/3ItLsIWweFQ

Создание компьютеров, способных распознавать эмоции музыки, также улучшает способы взаимодействия людей и компьютеров.

Можно воспроизводить музыку, соответствующую настроениям пользователя, обнаруженным по физиологическим, ритмическим или лицевым подсказкам.

Портативные устройства, такие как MP3-плеер или сотовый телефон, оснащенные функцией автоматического распознавания музыкальных эмоций, могут воспроизводить песню, наилучшим образом соответствующую эмоциональному состоянию пользователя.

Интеллектуальное пространство например, ресторан, конференц-зал, резиденция, может воспроизводить фоновую музыку, наиболее подходящую для находящихся в нем людей.

Стали появляться интерактивные ведущие контента, основанного на восприятии эмоций мультимедийного содержания и физиологической обратной связи с пользователем.

Мультимедийный контент (фотографии, музыка и статьи в веб-блогах) автоматически классифицируются на восемь классов эмоций: счастливый, легкий, легкий, трогательный, грустный, возвышенный, грандиозный и захватывающий.

Что же дальше?

Предпочтения пользователя в отношении этих эмоций определяются по физиологическим сигналам, таким как кровяное давление и проводимость кожи, и затем используются для рекомендации следующего трека.

Эта поисковая парадигма функционально сильна, так как критерии отбора музыки у людей часто связаны с эмоциональным состоянием на момент отбора.

В музыкально-поисковом сообществе (МПС) проделана значительная работа по автоматическому распознаванию воспринимаемых эмоций музыки.

Типичный подход к МПС подразделяет эмоции на несколько классов например: счастливые, злые, печальные и расслабленные.

Тут применяется методы машинного обучения для обучения.

Обычно тембровые, ритмические и гармонические черты музыки извлекаются, чтобы передать акустические свойства музыкального произведения.

Как правило, субъективный тест проводится для сбора информации, необходимой для обучения компьютерной модели прогнозирования эмоций.

Для изучения взаимосвязи между музыкальными особенностями и эмоциями было применено несколько алгоритмов машинного обучения, таких как: векторные аппараты поддержки, модели гаусса, нейросети.

После тренировки, автоматическая модель может быть применена для распознавания эмоций входного музыкального произведения.