Главная фишка в том, что нейросеть не просто переводит речь на другой язык. Она старается сохранить голос, интонацию, эмоции, темп и манеру речи оригинального спикера. То есть дубляж звучит не как сухая озвучка поверх перевода, а ближе к нормальной локализации. Модель учитывает, как человек говорит: где делает паузы, с каким настроением произносит фразы, где усиливает эмоцию или меняет подачу. Dubbing v2 также подстраивает перевод так, чтобы реплики звучали естественно на другом языке и совпадали по времени с оригинальной дорожкой. Это важно для видео, потому что дословный перевод часто получается слишком длинным или, наоборот, коротким, из-за чего сбивается синхронизация. Весь процесс проходит автоматически: сервис переводит речь, клонирует голос, делает дубляж и синхронизирует результат с исходным видео или аудио. Модель поддерживает более 90 языков и уже доступна в сервисах ElevenLabs. Такой инструмент может быть полезен авторам YouTube-каналов, блогерам, онлайн-школам, рекламным а
ElevenLabs представила Dubbing v2 — новую ИИ-модель для автоматического дубляжа видео и аудио.
31 мая31 мая
17
1 мин