Alibaba Cloud открыла доступ к набору голосовых нейросетей под названием Qwen3-TTS. Это не просто технический пакет, а целая система, в которой совмещены генерация аудиофайлов по тексту, клонирование голоса по короткому образцу и возможность управлять звучанием при помощи простых текстовых инструкций. Здесь говорится про синтез, где человеческий голос можно создать, задать по описанию или воспроизвести с минимального фрагмента — буквально за 3 секунды. Новый релиз имеетт три модели, каждая со своими возможностями. Базовый вариант ориентирован на быструю и качественную озвучку, ветка CustomVoice позволяет настраивать голос под нужный стиль, а VoiceDesign предлагает пользователю описывать будущий результат при помощи привычного языка, т. к. можно задать, каким будет тембр, ритм, эмоциональный оттенок. Это приближает систему к продюсерскому и редакторскому использованию, где ценится удобство настройки без сложных акустических параметров. Техническое устройство Qwen3-TTS базируется на совр