Найти в Дзене
ДаШаП ¯\_(ツ)_/¯

Как создать AI-кавер. Своя модель голоса. Путь Дилетанта

Захотелось создать кавер с помощью нейросети. Оказывается, это не так уж и легко. Расскажу вам о своей попытке. Я совсем не разбираюсь в программировании, кодах и прочих айтишных штуках, однако у меня получилось. Я потратила много времени, чтобы найти работающий, а главное достаточно удобный для обывателя способ, ну а вам достанется самый сок, сама сжатость и информативность из всех моих поисков. В этой статье я соберу все ссылки, которыми пользовалась. Хорошо, что существуют профессионалы, которые давно за нас всё сделали и объяснили, но плохо, что они раскидали свои мысли по всему интернету. Что ж, начнёмヾ(⌐■_■)ノ♪ Итак, вы выбрали песню, в которой хотите заменить вокал. Нужно выбрать голос для кавера. Есть база популярных голосов: ссылка. Но! Здесь мы будем говорить о создании своей модели. ЭТАП №1 И пошла первая ссылка: https://dzen.ru/video/watch/65ba5b3cac02d66f3a1545e4 В этом видео всё подробно рассказано, но кто хочет комментарии Дилетанта, покороче и в буковах, то милости про

Захотелось создать кавер с помощью нейросети. Оказывается, это не так уж и легко. Расскажу вам о своей попытке.

Я совсем не разбираюсь в программировании, кодах и прочих айтишных штуках, однако у меня получилось. Я потратила много времени, чтобы найти работающий, а главное достаточно удобный для обывателя способ, ну а вам достанется самый сок, сама сжатость и информативность из всех моих поисков.

В этой статье я соберу все ссылки, которыми пользовалась. Хорошо, что существуют профессионалы, которые давно за нас всё сделали и объяснили, но плохо, что они раскидали свои мысли по всему интернету.

Что ж, начнёмヾ(⌐■_■)ノ♪

Итак, вы выбрали песню, в которой хотите заменить вокал.

Нужно выбрать голос для кавера. Есть база популярных голосов: ссылка. Но! Здесь мы будем говорить о создании своей модели.

ЭТАП №1

И пошла первая ссылка: https://dzen.ru/video/watch/65ba5b3cac02d66f3a1545e4

В этом видео всё подробно рассказано, но кто хочет комментарии Дилетанта, покороче и в буковах, то милости прошу.

Нам нужна запись голоса.

Если человек известный, поищите с ним интервью или подкаст. Нам нужно где-то 5 минут его голоса. Если нашли аудио – просто отлично. Если видео – не боитесь, разберёмся.

Нужно скачать видео (если оно есть в ВК, то вам поможет приложение "Видео ВК"). Также можно сделать запись экрана через телефон. Запишите 5 минут интервью.

Дальше нам понадобится редактор. У меня – "Movavi", но можно использовать любой онлайн-редактор или же любое приложение типа "YouCut - Video Editor", если вам удобнее редактировать на смартфоне.

Необходимо отделить звук от картинки. Делаем! Дальше нужно вырезать из аудиодорожки паузы, шипения, вздохи, кряхтения и прочие шумы, чтобы наша запись была почище.

Отлично. Важно! Сохранить голос надо в формате wav. WAV!

Теперь из этого мы будем делать модель голоса.

Нужен гугл-диск и место на нём (несколько гигов).

Пошла вторая ссылка: Google Colab.

Всё остальное мы делаем тут. Вот так выглядит начало:

Тезисно!

Щелкаете тут

-2

, потом здесь

-3

. Через какое-то время начнут всплывать предупреждающие окна. Итак (¬‿¬)

"Выполнить"

-4

, "подключить"

-5

, выбираете себя

-6

, "продолжить"

-7

и ещё раз

-8

. Пока мы соглашались, установка завершилась ¯\_(ツ)_/¯

-9

Идём дальше! Кликаем на папочку

-10

, сюда

-11

, загружаем наш голос (WAV)

-12

. Дождитесь, пока файл загрузится (появится его вес).

Дальше пишем имя

-13

и нажимаем

-14

. Ждём «готово»

-15

Далее идёт "Тренировка модели".

-16

Нам нужна вот эта строчка

-17

. Если у вас русский голос, ставьте Snowie, если английский, оставьте Default.

-18

Теперь нажимайте сюда

-19

. Пошли строчки. Страшно, понимаю, но надеемся, что всё идёт по плану •_•)

-20

Когда увидели «Эпохи», можете выдохнуть, всё сработало верно. Ждём, пока натренируется (чтобы это не значило) модель. Это может занять некоторое время (от 10 до 30 минут)

-21

, затем появятся надписи:

-22

Отлично. Выходим из этого всего. Нажимаем это

-23

, потом это

-24

. Здесь закончили. *фуууух*

ЭТАП №2

Открываем гугл-диск. Здесь появилась папка «TrainingModel».

-25

Открываем. Там куча папок. Кликаем

-26

, так

-27

, прокручиваем вниз. Нам нужен файл, заканчивающийся на <…>.index

-28

Возвращаемся в «TrainingModel». Находим папку

-29

, далее

-30

. Вот этот файл берём

-31

. У вас должны быть загружены 2 файла added<…>.index и <…>.pth

Молодцы!

Теперь наши скачанные файлы необходимо заархивировать. Открываем «Загрузки» или ту папку, в которой вы сохранили файлы.

Выделяем их – правая кнопка мыши – отправить – сжатая zip-папка.

-32

-33

Сделано! У нас есть модель голоса, которую мы подставим вместо оригинального.

ЭТАП №3

А теперь ещё одно видео, как сделать уже сам кавер от автора (Politrees), которому мы все желаем здоровья и успехов.

Третья пошла: https://dzen.ru/video/watch/668e402375153d43b37642cd

И пояснения от Дилетанта ッ

Если ещё раз открыть RVС Politrees и промотать в самый низ, там будет ссылка

-34

, нажмите ииии… Вот наш CoverGen

-35

Или же сразу ссылка (◕‿◕)

Нажимаем сюда

-36

, сюда

-37

, соглашаемся

-38

и ждём пока программа установится.

-39

Хорошечно.

Кликаем и ждём

-40

. Когда появится вот эта ссылка - мы дождались. Переходим по ней.

-41

Перед нами его величество CoverGen.

-42

Внешне он будет отличаться, от того, что показан в видео, но по функционалу он такой же, даже лучше, потому что все проблемки автор, как и обещал, устранил.

Нажимаем сюда

-43

, теперь сюда

-44

. Добавляем ZIP-папку, которую так долго делали

-45

, ждём, пока загрузится (несколько минут).

Называем и нажимаем

-46

. Далее сюда

-47

, кликает здесь

-48

, здесь

-49

, тут

-50

. Двигаемся правей

-51

и загружаем песню, которую выбрали для кавера. Подождите, пока она отобразится (в виде ссылки).

Отлично!

Аудионастройки автор оставил самые универсальные, поэтому пока не трогайте их.

И наконец кликаем «Генерировать»!

-52

Ждём несколько минут…Пожалуйста! Ваш кавер появился! ╰(▔∀▔)╯

-53

После первого прослушивания, можете покрутить настройки, чтобы улучшить звучание. В программе подробно описано, что делает каждая настройка, но также это хорошо объясняется в видео (2:21).

Если вас всё устраивает, скачивайте mp3.

-54

Как-то так ¯\_(ツ)_/¯

Говорим огромное спасибо автору (как я поняла) RVС Politrees и создателю CoverGen. Ссылка на его страницу в Дзене.