Специалисты Новосибирского государственного технического университета разработали программное обеспечение для генерации аудиоконтента с помощью нейросетей. Система способна создавать музыку, вокал и звуковые эффекты по текстовому описанию. Как сообщил ТАСС руководитель проекта Егор Антонянц, программа работает автономно и не требует подключения к зарубежным платформам. Она запускается на обычных компьютерах с объемом видеопамяти менее 6 ГБ и поддерживает популярные форматы — WAV, MP3 и FLAC. Разработчики дообучили модель для трех типов контента: инструментальной музыки, песен с вокалом и звуковых эффектов. Это позволяет точнее соответствовать запросу пользователя и избегать смешения характеристик. Система адаптирована для русскоязычных пользователей и показывает высокое качество генерации. Средняя оценка результата составила 4,1 балла из 5, что сопоставимо с коммерческими сервисами. По словам разработчика Артура Хусаинова, процесс создания аудио проходит в несколько этапов: сначала фор