Найти в Дзене

SoundStorm

SoundStorm — нейронка от Google для генерации полноценного человеческого диалога из текста. Для создания такого диалога нужно две вещи: текстовый промпт речи и образец голоса. Далее нейронка разбивает звуковые волны на нейронные аудиокодеки и синтезирует супер реалистичный диалог высокого качества. SoundStorm способен синтезировать 30 секунд звука за полсекунды. Проблема, с которой столкнулись разработчики, заключалась в том, что нейросеть могли бы использовать злоумышленники и телефонные мошенники. Пока нейросеть не планируют выводить в открытый доступ, так как ей нужно продолжать обучение.

SoundStorm — нейронка от Google для генерации полноценного человеческого диалога из текста. Для создания такого диалога нужно две вещи: текстовый промпт речи и образец голоса. Далее нейронка разбивает звуковые волны на нейронные аудиокодеки и синтезирует супер реалистичный диалог высокого качества.

SoundStorm способен синтезировать 30 секунд звука за полсекунды. Проблема, с которой столкнулись разработчики, заключалась в том, что нейросеть могли бы использовать злоумышленники и телефонные мошенники.

Пока нейросеть не планируют выводить в открытый доступ, так как ей нужно продолжать обучение.