Найти тему
Нота.

Распознавание эмоций среди прослушивания больших объемов музыкальных композиций.

Оглавление

Модели и методы.

Модель окружности впервые была принята исследователями MER для отслеживания эмоциональных вариаций классической песни (ЭВКП).

Идея представления общей эмоции популярной песни как точки в плане эмоций для поиска музыки упоминается в работах Янга.
Исходя из того, доминирующая эмоция популярной песни претерпевает меньше изменений, чем классическая.

Создатели сформулировали MER как задачу регрессии и обучили две независимые регрессионные модели (регрессоры) прогнозированию валентности и возбуждающей способности (VA) музыкального произведения.

Связанное со значениями VA, каждое музыкальное произведение визуализируется как точка эмоциональной плоскости, и сходство музыкальных сэмплов может быть оценено путем вычисления эвклидового расстояния в эмоциональной плоскости.

Регрессионный подход имеет прочную теоретическую основу и демонстрирует многообещающую точность прогнозирования.

ссылка на фото: unsplash.com/photos/X1gTLgWMDKg
ссылка на фото: unsplash.com/photos/X1gTLgWMDKg

Достоинствами этого подхода являются двумерный пользовательский интерфейс и связанные с ним методы поиска, основанные на эмоциях, которые могут быть созданы для мобильных устройств с небольшими областями отображения.

Например, пользователь может указать точку на плоскости для получения композиций определенной эмоции или нарисовать траекторию для создания плейлиста композиций с различными эмоциями, соответствующими точкам на траектории.

Кроме того, поскольку плоскость эмоций неявно предлагает бесконечное количество описаний эмоций, вопрос детализации и двусмысленности, связанный с классами эмоций, смягчается.

Использование валентности и возбуждения в качестве двух измерений эмоций, хотя они в значительной степени основаны на психологии, также было эмпирически подтверждено исследователями MER.

В работах Леви и Сэндлера и Лорье исследователи исследовали семантическое пространство эмоций, простирающееся от социальных музыкальных тегов, и обнаружили, что производное семантическое пространство соответствует пространству вальса-арусальных эмоций.

Применяя факторный анализ эмоциональных аннотаций, 15 биполярных аффективных терминов, было также установлено, что основное 3D пространство характеризуется валентностью, активностью и интересом, что довольно близко к модели валентности арустальной силы.

Далее будет написано о субъективной аннотации, обучения модели и визуализации результатов существующих объемных работ программы.

Субъективная аннотация.

В отличие от классификационного, размерный MER требует от субъектов аннотации числовых значений VA.

ссылка на фото: unsplash.com/photos/NDfqqq_7QWM
ссылка на фото: unsplash.com/photos/NDfqqq_7QWM

Это можно сделать:

  1. По стандартной рейтинговой шкале.
  2. По графической рейтинговой шкале.
Например, в работе Янга субъектов попросили оценить значения VA от -1.0 до 1.0 в одиннадцати порядковых уровнях.

В других методах использовалась семибалльная шкала, реализованная в виде радиокнопки, состоящей из ряда семи кругов с противоположным семантическим дифференциальным элементом на каждом конце.

Субъектов попросили оценить значения VA с помощью графического интерфейса "AnnoEmo".

Значения VA аннотируются нажатием на плоскость эмоций, отображаемую компьютером.

ссылка на фото: unsplash.com/photos/8_EAzzAA3bg
ссылка на фото: unsplash.com/photos/8_EAzzAA3bg

Прямоугольник формируется по указанной точке, чтобы субъект мог непосредственно сравнивать аннотации различных музыкальных произведений.

Объект может нажать на прямоугольник, чтобы прослушать отрывок еще раз, или перетащить прямоугольник, чтобы изменить аннотации.

Независимо от используемого метода аннотации, каждое музыкальное произведение часто аннотируется несколькими субъектами, и основная истина заключается в среднем рейтинге, поскольку восприятие эмоций субъективно.

Алгоритмы, могут быть использованы для удаления выбросов аннотаций, которые существенно отличаются от других.

И в заключение о результате визуализации.

При наличии обученных регрессоров значения VA композиции автоматически предсказываются без дополнительной ручной маркировки.

Каждое музыкальное произведение, связанное со значениями VA, визуализируется как точка эмоциональной плоскости.

Многие новые методы извлечения информации могут быть реализованы в эмоциональном плане, что делает доступ к музыкальной информации намного проще и эффективнее.

Например, можно легко получить музыкальные произведения, вызывающие определенные эмоции, не зная названий и не просматривая личные коллекции в плоскости эмоций на мобильных устройствах.

Также можно сочетать поиск, основанный на эмоциях, с традиционными ключевыми словами или словами композитора, чтобы найти песни, схожие (в смысле воспринимаемых эмоций) с любимым произведением или выбрать песни автора в соответствии с эмоциями.

Появилась также возможность составить плейлист, нарисовав свободную траекторию, представляющую собой последовательность эмоций в плоскости эмоций.

По мере перехода от одного квадранта к другому эмоции композиций в плейлисте будут меняться.

Должны ли эмоции быть смоделированы в виде категорий или континуумов - это долгие споры в психологии.

С инженерной точки зрения категорический и размерный подходы предлагают различные преимущества, которые дополняют друг друга.

Можно представить себе мобильное устройство, использующее оба подхода для облегчения поиска музыки.

Продолжение следует...

Спасибо за внимание, всего хорошего!

Вот ссылка на предыдущий материал: https://zen.yandex.ru/media/id/5dc9a91568e68b209078723b/subektivnaia-annotaciia-emocii-poluchennyh-ot-zvuchaniia-muzyki-5dd04a23760122197c9b0efe