Недавно Nvidia представила свою новую аудиомодель под названием Fugatto, которая может синтезировать звуки, ранее не существовавшие в природе. Эта модель, основанная на передовых методах синтетического обучения, стремится объединить музыку, голоса и различные звуковые эффекты в уникальные комбинации. В отличие от своих предшественников, Fugatto предлагает пользователям возможность настраивать звуковые характеристики, создавая, например, звук саксофона, играющего под водой, или сирены, поющей в хоре. Несмотря на то что Fugatto пока не доступна для широкой публики, демонстрация возможностей модели на веб-сайте компании уже произвела впечатление на экспертов. Nvidia описывает Fugatto как «швейцарский армейский нож для звука», подчеркивая его универсальность и потенциал. Создание обучающего набора данных для Fugatto стало настоящим вызовом для исследователей. Они столкнулись с необходимостью выявить значимые связи между аудио и языком. В отличие от стандартных языковых моделей, которые мог
Nvidia представила AI-модель Fugatto, способную создавать несуществующие звуки
26 ноября 202426 ноя 2024
2
3 мин