) Qwen ΠΎΡΠΈΡΠΈΠ°Π»ΡΠ½ΠΎ Π²ΡΠΏΡΡΡΠΈΠ»ΠΈ Qwen3-TTS ΠΈ ΠΏΠΎΠ»Π½ΠΎΡΡΡΡ ΠΎΡΠΊΡΡΠ»ΠΈ Π²ΡΡ Π»ΠΈΠ½Π΅ΠΉΠΊΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ - Base / CustomVoice / VoiceDesign. Π§ΡΠΎ Π²Π½ΡΡΡΠΈ: - 5 ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (0.6B ΠΈ 1.8B ΠΊΠ»Π°ΡΡΡ) - Free-form Voice Design - Π³Π΅Π½Π΅ΡΠ°ΡΠΈΡ/ΡΠ΅Π΄Π°ΠΊΠ²ΡΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ Π³ΠΎΠ»ΠΎΡΠ° ΠΏΠΎ ΠΎΠΏΠΈΡΠ°Π½ΠΈΡ - Voice Cloning - ΠΊΠ»ΠΎΠ½ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ Π³ΠΎΠ»ΠΎΡΠ° - 10 ΡΠ·ΡΠΊΠΎΠ² - 12Hz tokenizer - ΡΠΈΠ»ΡΠ½Π°Ρ ΠΊΠΎΠΌΠΏΡΠ΅ΡΡΠΈΡ Π°ΡΠ΄ΠΈΠΎ Π±Π΅Π· ΡΠΈΠ»ΡΠ½ΠΎΠΉ ΠΏΠΎΡΠ΅ΡΠΈ ΠΊΠ°ΡΠ΅ΡΡΠ²Π° - ΠΏΠΎΠ»Π½Π°Ρ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° fine-tuning - Π·Π°ΡΠ²Π»ΡΡΡ SOTA ΠΊΠ°ΡΠ΅ΡΡΠ²ΠΎ Π½Π° ΡΡΠ΄Π΅ ΠΌΠ΅ΡΡΠΈΠΊ Π Π°Π½ΡΡΠ΅ Π»ΡΡΡΠΈΠ΅ Π³Π΅Π½Π΅ΡΠ°ΡΠΎΡΡ Π±ΡΠ»ΠΈ Π² Π·Π°ΠΊΡΡΡΡΡ
API, Π° ΡΠ΅ΠΏΠ΅ΡΡ ΠΏΠΎΡΠ²Π»ΡΠ΅ΡΡΡ ΠΏΠΎΠ»Π½ΠΎΡΠ΅Π½Π½ΡΠΉ open-source ΡΡΠ΅ΠΊ TTS, Π³Π΄Π΅ ΠΌΠΎΠΆΠ½ΠΎ: - ΠΎΠ±ΡΡΠ°ΡΡ ΠΏΠΎΠ΄ Π΄ΠΎΠΌΠ΅Π½, - Π΄Π΅Π»Π°ΡΡ ΠΊΠ°ΡΡΠΎΠΌΠ½ΡΠ΅ Π³ΠΎΠ»ΠΎΡΠ°, - ΠΈ Π½Π΅ Π·Π°Π²ΠΈΡΠ΅ΡΡ ΠΎΡ ΠΏΡΠΎΠ²Π°ΠΉΠ΄Π΅ΡΠ°. βͺGitHub: https://github.com/QwenLM/Qwen3-TTS βͺHugging Face: https://huggingface.co/collections/Qwen/qwen3-tts βͺΠΠ΅ΠΌΠΎ (HF): https://huggingface.co/spaces/Qwen/Qwen3-TTS βͺΠΠ»ΠΎΠ³: https://qwen.ai/blog?id=qwen3tts-0115 βͺPaper: https://github.com/QwenLM/Qwen3-TTS/blob/main/assets/Qwen3_TTS.pdf @machinelearning #AI #TTS #Qwen #OpenSource #SpeechAI
π£ Qwen3-TTS - ΠΌΠΎΡΠ½ΡΠΉ open-source ΡΠ΅Π»ΠΈΠ· (voice design + ΠΊΠ»ΠΎΠ½ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ Π³ΠΎΠ»ΠΎΡΠ°
22Β ΡΠ½Π²Π°ΡΡ22Β ΡΠ½Π²
7
~1 ΠΌΠΈΠ½