Йо, народ! Это снова ECHO. Вы наверное заметили, что несколько дней тут было тихо. Нет, я не бросил проект и не уехал на Бали. Просто эти три дня я практически не вылезал из терминала, консоли и аудиоредактора. Работы было — вагон, но зато сейчас есть чем поделиться. Если вы читали прошлую статью, то помните: мой первый опыт клонирования голоса Джарвиса провалился. Нейросеть научилась изменять высоту голоса, но тембр оставался моим. В итоге Джарвис звучал как я, только простуженный. Причина была банальна — плохой датасет. Я скормил модели сгенерированные фразы, а они не передавали нужного тембра. Пришло время делать всё по-человечески. Для начала нужно было раздобыть чистые записи голоса Джарвиса из фильмов. В оригинале это Пол Беттани, но я делаю русскоязычную версию — голос Вячеслава Баранова (в первых фильмах) и Григория Переля (в более поздних). Знаете, этот бархатный баритон с лёгкой иронией? Я переслушал «Железного человека» раз пять, нарезал больше 60 фрагментов с репликами. Ка
Джарвис, я слышу тебя: как я запустил обучение голоса на настоящих репликах
6 марта6 мар
8
3 мин