Команда Qwen от Alibaba открыла исходный код семейства моделей Qwen3-TTS с преобразованием текста в речь. Новинка обеспечивает синтез в реальном времени (задержка 97 мс), поддержку множества языков и передовое качество голоса, включая клонирование и генерацию эмоций. 22 января 2026 года — Команда Qwen от Alibaba официально представила в открытый доступ полную серию моделей преобразования текста в речь Qwen3-TTS, включающую модели с многокодовыми речевыми представлениями в двух размерах: 1,7 миллиарда параметров для максимальной производительности и 0,6 миллиарда параметров, оптимизированных для баланса качества и эффективности. Модели теперь доступны на GitHub, ModelScope и других платформах, при этом живой доступ поддерживается через API Qwen. Qwen3-TTS предлагает всеобъемлющий набор функций, включая клонирование голоса, генерацию голоса, синтез речи, максимально приближенный к человеческому, и управление синтезом с помощью инструкций на естественном языке. Благодаря саморазработанном
Alibaba представила семейство моделей Qwen3-TTS с открытым исходным кодом, обеспечивающее мультиязычную генерацию речи с ультранизкой задержкой.
23 января23 янв
1
2 мин