Alibaba выпустила Qwen3-TTS — опенсорс-систему синтеза речи на базе end-to-end-архитектуры. Модель клонирует голос по трёхсекундному аудиофрагменту, поддерживает русский язык и сохраняет естественные интонации без роботизированности. Доступны дополнительные функции: • Voicedesign для генерации тембров по текстовому описанию • режим создания сложных диалогов Запуск возможен локально на Windows 11 через портативную сборку для GPU или CPU. Модель 1.7B работает быстро даже на средних компьютерах. https://dzen.ru/id/5c0e38ff46ef5c00aaa80527
Alibaba представила Qwen3-TTS для клонирования голоса за 3 секунды
ВчераВчера
~1 мин