Mistral выпустила голосовой ИИ, который обыгрывает ElevenLabs, и отдаёт веса модели в открытый доступ
Mistral AI выпустила Voxtral TTS — первую модель синтеза речи из текста с открытыми весами для корпораций. Модель в три раза компактнее конкурентов, генерирует речь в шесть раз быстрее реального времени и работает на любом устройстве без отправки данных третьим лицам, обеспечивая предприятиям полный контроль над технологией. Рынок корпоративного голосового ИИ сейчас переживает настоящую битву. На этой неделе ElevenLabs и IBM объявили о сотрудничестве, Google Cloud расширяет возможности Chirp 3 HD, OpenAI продолжает улучшать синтез речи...