Найти в Дзене

Автоматическая генерация музыки — штука гораздо более древняя, чем автоматическая генерация изображений. Но последнее время что-то меньше слышно про музыку, чем про картинки или видео.


В OpenAI решили это исправить — все-таки современные возможности, породившие и GPT-2 для текстов, и DALLE 2 для изображений должны и для звуков открыть что-то ранее невозможное и сильно более интересное чем MuseNet, которую учили на MIDI.

А теперь — отобранный дотасет из 1,2 млн песен (из которых половина на английском), усложнение модели, которое позволяет провязать текст песни с ее мелодией — и вот вам модель , которая по введенному тексту и указанию жанра генерит готовую песенку:)

Правда, тут пока не светит никакого интерактива: на генерацию одной минуты песни уходит 9 часов расчетов, это совсем не “на лету”.

Но результаты занятные, созданная модель впечатляет, а у кого-то из музыкантов наверняка начнет подгорать как у иллюстраторов последний месяц :)

Около минуты