Найти Ρ‚Π΅ΠΌΡƒ
9992 подписчика

πŸ—£ HierSpeech++: Bridging the Gap between Semantic and Acoustic Representation by Hierarchical Variational Inference for Zero-shot Speech Synthesis


Π‘ΠΈΠ½Ρ‚Π΅Π· Ρ€Π΅Ρ‡ΠΈ Π½Π° основС Π±ΠΎΠ»ΡŒΡˆΠΈΡ… языковых ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ» ΡˆΠΈΡ€ΠΎΠΊΠΎΠ΅ распространСниС.

Однако Ρ‚Π°ΠΊΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‚ большого объСма Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΎΠ±Π»Π°Π΄Π°ΡŽΡ‚ Ρ‚Π΅ΠΌΠΈ ΠΆΠ΅ нСдостатками, Ρ‡Ρ‚ΠΎ ΠΈ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΠ΅ авторСгрСссионныС ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ€Π΅Ρ‡ΠΈ, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ Π½ΠΈΠ·ΠΊΡƒΡŽ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ Π²Ρ‹Π²ΠΎΠ΄Π° ΠΈ ΠΏΠ»ΠΎΡ…ΠΎΠ΅ качСтсво Ρ€Π΅Ρ‡ΠΈ.

Π’ Π΄Π°Π½Π½ΠΎΠΉ Ρ€Π°Π±ΠΎΡ‚Π΅ прСлставлСн HierSpeech++, быстрый ΠΈ Π½Π°Π΄Π΅ΠΆΠ½Ρ‹ΠΉ синтСзатор Ρ€Π΅Ρ‡ΠΈ для прСобразования тСкста Π² Ρ€Π΅Ρ‡ΡŒ (TTS) ΠΈ голоса (VC).

Данная модСль синтСза Ρ€Π΅Ρ‡ΠΈ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‚ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΠΎΠ²Ρ‹ΡΠΈΡ‚ΡŒ Π½Π°Π΄Π΅ΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΈ Π²Ρ‹Ρ€Π°Π·ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ синтСтичСской Ρ€Π΅Ρ‡ΠΈ.

ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΎ Π΅ΡΡ‚Π΅ΡΡ‚Π²Π΅Π½Π½ΠΎΡΡ‚ΡŒ ΠΈ сходство с Π΄ΠΈΠΊΡ‚ΠΎΡ€ΠΎΠΌ синтСтичСской Ρ€Π΅Ρ‡ΠΈ Π΄Π°ΠΆΠ΅ Π² сцСнариях синтСза Ρ€Π΅Ρ‡ΠΈ с Π½ΡƒΠ»Π΅Π²Ρ‹ΠΌ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠΌ.






πŸ—£ HierSpeech++: Bridging the Gap between Semantic and Acoustic Representation by Hierarchical Variational Inference for Zero-shot Speech Synthesis  Π‘ΠΈΠ½Ρ‚Π΅Π· Ρ€Π΅Ρ‡ΠΈ Π½Π° основС Π±ΠΎΠ»ΡŒΡˆΠΈΡ… языковых ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ...
Около ΠΌΠΈΠ½ΡƒΡ‚Ρ‹