Nvidia Nvidia выпустила новую генеративную аудио модель ИИ, способную создавать множество звуков, музыки и даже голосов на основе простых текстовых и аудиоподсказок пользователя. Названная Fugatto (также известная как Foundational Generative Audio Transformer Opus 1), модель может, к примеру, создавать джинглы и фрагменты песен исключительно по текстовым подсказкам, добавлять или удалять инструменты и вокал из существующих композиций, изменять как акцент, так и эмоции голоса и «даже позволять людям производить звуки, которые никогда не были слышны раньше», согласно объявлению, сделанному в понедельник. «Мы хотели создать модель, которая понимает и генерирует звук так, как это делают люди», - сказал Рафаэль Валье, менеджер по прикладным исследованиям аудио в Nvidia. «Fugatto — это наш первый шаг к будущему, где неврачебное многозадачное обучение в аудиосинтезе и трансформации будет осуществляться на основе данных и масштабов модели.» Компания отмечает, что музыкальные продюсеры могут и
Новая модель ИИ от Nvidia создает музыку на основе текстов и аудиоподсказок
4 декабря 20244 дек 2024
1
2 мин