Mistral готовят к релизу Voxtral — новую TTS-модель на 3 млрд параметров. Официального анонса ещё не было, но она уже работает в Mistral Playground. Что важно: открытый исходный код. ElevenLabs — платный и закрытый. Voxtral можно будет развернуть локально бесплатно. По первым тестам обходит ElevenLabs V2.5 Flash по качеству речи. Уже сейчас доступны готовые голоса (Curious, Confident, Excited и другие) и клонирование голоса через вкладку "My Voices". Для разработчиков это особенно интересно — API уже доступен через Mistral Playground, можно встраивать в продукты прямо сейчас. Если подтвердится качество в независимых тестах — это серьёзный удар по платным TTS-сервисам. Как оплатить ElevenLabs и другие голосовые нейросети из России — https://youtu.be/4ecG4obJ-1A
Mistral выпускают Voxtral — открытый TTS который бьёт ElevenLabs
2 дня назад2 дня назад
3
~1 мин