Найти Π² Π”Π·Π΅Π½Π΅
МашинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

πŸ—£ Qwen3-TTS - ΠΌΠΎΡ‰Π½Ρ‹ΠΉ open-source Ρ€Π΅Π»ΠΈΠ· (voice design + ΠΊΠ»ΠΎΠ½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ голоса

) Qwen ΠΎΡ„ΠΈΡ†ΠΈΠ°Π»ΡŒΠ½ΠΎ выпустили Qwen3-TTS ΠΈ ΠΏΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ ΠΎΡ‚ΠΊΡ€Ρ‹Π»ΠΈ всю Π»ΠΈΠ½Π΅ΠΉΠΊΡƒ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ - Base / CustomVoice / VoiceDesign. Π§Ρ‚ΠΎ Π²Π½ΡƒΡ‚Ρ€ΠΈ: - 5 ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (0.6B ΠΈ 1.8B классы) - Free-form Voice Design - гСнСрация/Ρ€Π΅Π΄Π°ΠΊΠ²Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ голоса ΠΏΠΎ описанию - Voice Cloning - ΠΊΠ»ΠΎΠ½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ голоса - 10 языков - 12Hz tokenizer - сильная компрСссия Π°ΡƒΠ΄ΠΈΠΎ Π±Π΅Π· сильной ΠΏΠΎΡ‚Π΅Ρ€ΠΈ качСства - полная ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° fine-tuning - Π·Π°ΡΠ²Π»ΡΡŽΡ‚ SOTA качСство Π½Π° рядС ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ РаньшС Π»ΡƒΡ‡ΡˆΠΈΠ΅ Π³Π΅Π½Π΅Ρ€Π°Ρ‚ΠΎΡ€Ρ‹ Π±Ρ‹Π»ΠΈ Π² Π·Π°ΠΊΡ€Ρ‹Ρ‚Ρ‹Ρ… API, Π° Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ появляСтся ΠΏΠΎΠ»Π½ΠΎΡ†Π΅Π½Π½Ρ‹ΠΉ open-source стСк TTS, Π³Π΄Π΅ ΠΌΠΎΠΆΠ½ΠΎ: - ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒ ΠΏΠΎΠ΄ Π΄ΠΎΠΌΠ΅Π½, - Π΄Π΅Π»Π°Ρ‚ΡŒ кастомныС голоса, - ΠΈ Π½Π΅ Π·Π°Π²ΠΈΡΠ΅Ρ‚ΡŒ ΠΎΡ‚ ΠΏΡ€ΠΎΠ²Π°ΠΉΠ΄Π΅Ρ€Π°. β–ͺGitHub: https://github.com/QwenLM/Qwen3-TTS β–ͺHugging Face: https://huggingface.co/collections/Qwen/qwen3-tts β–ͺΠ”Π΅ΠΌΠΎ (HF): https://huggingface.co/spaces/Qwen/Qwen3-TTS β–ͺΠ‘Π»ΠΎΠ³: https://qwen.ai/blog?id=qwen3tts-0115 β–ͺPaper: https://github.com/QwenLM/Qwen3-TTS/blob/main/assets/Qwen3_TTS.pdf @machinelearning #AI #TTS #Qwen #OpenSource #SpeechAI

πŸ—£ Qwen3-TTS - ΠΌΠΎΡ‰Π½Ρ‹ΠΉ open-source Ρ€Π΅Π»ΠΈΠ· (voice design + ΠΊΠ»ΠΎΠ½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ голоса)

Qwen ΠΎΡ„ΠΈΡ†ΠΈΠ°Π»ΡŒΠ½ΠΎ выпустили Qwen3-TTS ΠΈ ΠΏΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ ΠΎΡ‚ΠΊΡ€Ρ‹Π»ΠΈ всю Π»ΠΈΠ½Π΅ΠΉΠΊΡƒ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ - Base / CustomVoice / VoiceDesign.

Π§Ρ‚ΠΎ Π²Π½ΡƒΡ‚Ρ€ΠΈ:

- 5 ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (0.6B ΠΈ 1.8B классы)

- Free-form Voice Design - гСнСрация/Ρ€Π΅Π΄Π°ΠΊΠ²Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ голоса ΠΏΠΎ описанию

- Voice Cloning - ΠΊΠ»ΠΎΠ½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ голоса

- 10 языков

- 12Hz tokenizer - сильная компрСссия Π°ΡƒΠ΄ΠΈΠΎ Π±Π΅Π· сильной ΠΏΠΎΡ‚Π΅Ρ€ΠΈ качСства

- полная ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° fine-tuning

- Π·Π°ΡΠ²Π»ΡΡŽΡ‚ SOTA качСство Π½Π° рядС ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ

РаньшС Π»ΡƒΡ‡ΡˆΠΈΠ΅ Π³Π΅Π½Π΅Ρ€Π°Ρ‚ΠΎΡ€Ρ‹ Π±Ρ‹Π»ΠΈ Π² Π·Π°ΠΊΡ€Ρ‹Ρ‚Ρ‹Ρ… API, Π° Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ появляСтся ΠΏΠΎΠ»Π½ΠΎΡ†Π΅Π½Π½Ρ‹ΠΉ open-source стСк TTS, Π³Π΄Π΅ ΠΌΠΎΠΆΠ½ΠΎ:

- ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒ ΠΏΠΎΠ΄ Π΄ΠΎΠΌΠ΅Π½,

- Π΄Π΅Π»Π°Ρ‚ΡŒ кастомныС голоса,

- ΠΈ Π½Π΅ Π·Π°Π²ΠΈΡΠ΅Ρ‚ΡŒ ΠΎΡ‚ ΠΏΡ€ΠΎΠ²Π°ΠΉΠ΄Π΅Ρ€Π°.

β–ͺGitHub: https://github.com/QwenLM/Qwen3-TTS

β–ͺHugging Face: https://huggingface.co/collections/Qwen/qwen3-tts

β–ͺΠ”Π΅ΠΌΠΎ (HF): https://huggingface.co/spaces/Qwen/Qwen3-TTS

β–ͺΠ‘Π»ΠΎΠ³: https://qwen.ai/blog?id=qwen3tts-0115

β–ͺPaper: https://github.com/QwenLM/Qwen3-TTS/blob/main/assets/Qwen3_TTS.pdf

@machinelearning

#AI #TTS #Qwen #OpenSource #SpeechAI

Open Source
12 тыс ΠΈΠ½Ρ‚Π΅Ρ€Π΅ΡΡƒΡŽΡ‚ΡΡ