36,3 тыс подписчиков

Авторы Stable Diffusion запускают нейросеть для создания музыки

15 сентября 202315 сен 2023

~1 мин

Компания Stability AI анонсировала новую технологию Stable Audio, которая позволит создавать короткие аудиодорожки по текстовым запросам. Подобно методам искусственного интеллекта (ИИ), лежащим в основе Stable Diffusion, новая технология использует LLM-модель, обученную на аудиоданных. Пользователям предложат текстом описать желаемую музыку, а затем ИИ сгенерирует ее, пишет Venture.

В Stability AI заявили, что это первый опыт компании в области генерации музыки и аудио, так как раньше она занималась только изображениями. Stable Audio работает с необработанными аудиосэмплами, что станет обеспечивать высокое качество музыки. Нейросеть была обучена на 800 тысячах лицензионных аудиозаписей.

Новая модель может похвастаться 1,2 млрд параметров, как и оригинальная модель Stable Diffusion, которая применяется для генерации изображений.

Сервис будет бесплатным, но в нем также имеются Pro-планы, которые стоят 12 долларов и позволяют получить более длинные треки.

Ранее компания «Яндекс» открыла доступ к тестированию быстрых ответов YandexGPT в «Поиске».