1247 подписчиков

Доброе утро, аудиофилы, аудиомейкеры, наши дорогие подписчики!

В очередной раз убеждаемся в том, что будущее не просто мчится, а уже буквально наступает на пятки. В Китае нейросети научили превращать речь в пение на основе голосов живых людей🧐

Алгоритм основан на предыдущей разработке Tencent — нейросети DurIAN, которая умеет синтезировать реалистичные видеоролики на основе речи. Научные сотрудники заменили несколько блок-схем, куда загружались изображения, и закачали полтора часа пения и 28 часов речи.

🤖В итоге после обработки усовершенствований алгоритм в прямом смысле… запел! На один аудиофайл машина тратила не более 20 секунд.

По словам китайских разработчиков, сейчас система может работать в обе стороны – как конвертировать пение в речь, так и наоборот.

Доброе утро, аудиофилы, аудиомейкеры, наши дорогие подписчики! В очередной раз убеждаемся в том, что будущее не просто мчится, а уже буквально наступает на пятки.

Около минуты

16 июня 2023