1104 подписчика
Доброе утро, аудиофилы, аудиомейкеры, наши дорогие подписчики!
В очередной раз убеждаемся в том, что будущее не просто мчится, а уже буквально наступает на пятки. В Китае нейросети научили превращать речь в пение на основе голосов живых людей🧐
Алгоритм основан на предыдущей разработке Tencent — нейросети DurIAN, которая умеет синтезировать реалистичные видеоролики на основе речи. Научные сотрудники заменили несколько блок-схем, куда загружались изображения, и закачали полтора часа пения и 28 часов речи.
🤖В итоге после обработки усовершенствований алгоритм в прямом смысле… запел! На один аудиофайл машина тратила не более 20 секунд.
По словам китайских разработчиков, сейчас система может работать в обе стороны – как конвертировать пение в речь, так и наоборот.
Около минуты
16 июня 2023