Alibaba представила Qwen3-TTS для клонирования голоса за 3 секунды

31 января31 янв

~1 мин

Alibaba выпустила Qwen3-TTS — опенсорс-систему синтеза речи на базе end-to-end-архитектуры. Модель клонирует голос по трёхсекундному аудиофрагменту, поддерживает русский язык и сохраняет естественные интонации без роботизированности. Доступны дополнительные функции: • Voicedesign для генерации тембров по текстовому описанию • режим создания сложных диалогов Запуск возможен локально на Windows 11 через портативную сборку для GPU или CPU. Модель 1.7B работает быстро даже на средних компьютерах. https://dzen.ru/id/5c0e38ff46ef5c00aaa80527

Доступны дополнительные функции:

• Voicedesign для генерации тембров по текстовому описанию

• режим создания сложных диалогов

Запуск возможен локально на Windows 11 через портативную сборку для GPU или CPU. Модель 1.7B работает быстро даже на средних компьютерах.

https://dzen.ru/id/5c0e38ff46ef5c00aaa80527