ElevenLabs можно хоронить — вышла опенсорс-модель NeuTTS-Air, которая умеет клонировать любые голоса и работает локально прямо на вашем компе или даже
Никаких сливов и сторонних сервисов — всё приватно.
Достаточно трёх секунд записи, и нейронка соберёт с этим голосом хоть целый подкаст. Качество при этом очень близко к реальному, а скорость обработки высокая.
У модели 748 млн параметров — мощности хватает на любые задачи.
Пользуемся бесплатно тут.
Подробнее: https://hard-tm.su/threads/119362/