ссылка на предыдущие рассуждения. Часть №1-Введение После того, как я загорелся идеей оживлять текст голосами известных людей, встал вопрос — на чём это вообще делать? Технологий много, но не все одинаково удобны. Я провёл пару дней в поиске и вот к каким выводам пришёл. Сразу скажу: Bark — это безумно интересный проект, но пока не для практического использования. Модель клёвая для экспериментов, творчества и генерации, но не подходит под задачу, где нужно качество, стабильность и узнаваемый голос. На старте решаюсь идти по пути наименьшего сопротивления: ✅ Начинаю с OpenVoice. Это даёт мне возможность быстро получить работающий результат, протестировать идею и убедиться, что синтез реально звучит как «тот самый» голос. Если окажется, что у OpenVoice качество недостаточное, или не хватает гибкости, то я уже подготовлен: Я покажу, как именно запустил OpenVoice у себя на Windows, что получилось, как звучит клонированный голос и с какими проблемами столкнулся. 📢 Продолжение следует…
🎙️ Какую нейросеть выбрать для клонирования голосов? Мой путь между простотой и качеством. Часть №2
29 мая29 мая
4
1 мин