Найти в Дзене

Что же у нас получилось по голосовой модели(продолжаю прошлый пост).

Режущих звуков почти что нет, есть звуки дыхания, огромного эха как было раньше нет. Но местами(видимо за диапазон вокалиста выходит)в каверах колос как бы зажеван или запинается, в целом вокальная модель звучит получше, но большего пока, увы не добиться. Ну видимо ещё не научились нейросети петь высокие ноты вот никак- причем вначале он вам споёт их потом нет- будет хрипеть и запинаться.

Так что старайтесь не давать ии вокалу песни с высокими нотами.

Где то в другой статье писали про другую программу для создания голоса и каверов:

Ты ж программист: как сгенерировать голос известного музыканта с помощью нейросетей и искусственного интеллекта — SAMESOUND

"Как сгенерировать голос с помощью искусственного интеллекта

Для создания каверов с голосами известных исполнителей большинство авторов используют программу SoftVC VITS Singing Voice Conversion (So-VITS-SVC). Проект с открытым исходным кодом представляет собой модель на базе искусственного интеллекта, обучающуюся на основе аудиофайлов с записью голоса. Модель генерирует вокальные партии с голосом, на котором была обучена, при этом высота, характер и тембр не играют роли — So-VITS-SVC споёт вам так, как вы захотите".

Прочитав статью не уверен что это так. Даже если алгоритм работает как корректор питча, ну не может Канни Вэст спеть оперную арию или высокие ноты, если в его диапазон это изначально не заложено!