Найти в Дзене
NeuroWave

Авторы Stable Diffusion запускают нейросеть для создания музыки

   unsplash.com
unsplash.com

Компания Stability AI анонсировала новую технологию Stable Audio, которая позволит создавать короткие аудиодорожки по текстовым запросам. Подобно методам искусственного интеллекта (ИИ), лежащим в основе Stable Diffusion, новая технология использует LLM-модель, обученную на аудиоданных. Пользователям предложат текстом описать желаемую музыку, а затем ИИ сгенерирует ее, пишет Venture.

В Stability AI заявили, что это первый опыт компании в области генерации музыки и аудио, так как раньше она занималась только изображениями. Stable Audio работает с необработанными аудиосэмплами, что станет обеспечивать высокое качество музыки. Нейросеть была обучена на 800 тысячах лицензионных аудиозаписей.

Новая модель может похвастаться 1,2 млрд параметров, как и оригинальная модель Stable Diffusion, которая применяется для генерации изображений.

Сервис будет бесплатным, но в нем также имеются Pro-планы, которые стоят 12 долларов и позволяют получить более длинные треки.

Ранее компания «Яндекс» открыла доступ к тестированию быстрых ответов YandexGPT в «Поиске».