Компания Stability AI, наиболее известная нашумевшей нейросетью Stable Diffusion для генерации картинок по текстовому описанию, выпустила ещё одну интересную «нейронку» – Stable Audio. Как намекает название, она предназначена для генерации музыки.
Для обучения Stable Audio использовался тот же набор технологий, что и для Stable Diffusion. Модель обучалась на 800 000 фрагментах музыки из аудиотеки AudioSparks. Нейросеть работает напрямую с необработанными сэмплами для обеспечения высокого качества звука. На этой странице можно ознакомиться с несколькими примерами музыки разных жанров. К слову, все они кажутся подозрительно знакомыми.
Есть бесплатная версия, но с рядом ограничений: не больше 20 треков в месяц продолжительностью до 20 секунду. Pro-версия оценивается в $12 ежемесячно, позволяет 500 генераций длительностью до 90 секунд. Все детали на Stableaudio.com.
P.S. Так кстати есть немецкая группа Compressorhead, где 6 роботов исполняют хэви-метал и хард-рок на неадаптированных инструментах, то есть самых обычных. Идеальные компаньоны для Stable Audio.