Найти тему
1104 подписчика

Доброе утро, аудиофилы, аудиомейкеры, наши дорогие подписчики!


В очередной раз убеждаемся в том, что будущее не просто мчится, а уже буквально наступает на пятки. В Китае нейросети научили превращать речь в пение на основе голосов живых людей🧐

Алгоритм основан на предыдущей разработке Tencent — нейросети DurIAN, которая умеет синтезировать реалистичные видеоролики на основе речи. Научные сотрудники заменили несколько блок-схем, куда загружались изображения, и закачали полтора часа пения и 28 часов речи.

🤖В итоге после обработки усовершенствований алгоритм в прямом смысле… запел! На один аудиофайл машина тратила не более 20 секунд.

По словам китайских разработчиков, сейчас система может работать в обе стороны – как конвертировать пение в речь, так и наоборот.
Доброе утро, аудиофилы, аудиомейкеры, наши дорогие подписчики!  В очередной раз убеждаемся в том, что будущее не просто мчится, а уже буквально наступает на пятки.
Около минуты