Mistral AI выпустила Voxtral TTS — первую модель синтеза речи из текста с открытыми весами для корпораций. Модель в три раза компактнее конкурентов, генерирует речь в шесть раз быстрее реального времени и работает на любом устройстве без отправки данных третьим лицам, обеспечивая предприятиям полный контроль над технологией. Рынок корпоративного голосового ИИ сейчас переживает настоящую битву. На этой неделе ElevenLabs и IBM объявили о сотрудничестве, Google Cloud расширяет возможности Chirp 3 HD, OpenAI продолжает улучшать синтез речи. И вот Mistral AI вмешалась в игру совершенно неожиданным ходом. На прошлой неделе французский стартап выпустил Voxtral TTS — первую фронтальную модель синтеза речи из текста с открытыми весами, разработанную специально для корпораций. И вот в чём подвох: все конкуренты работают по принципу закрытой платформы с API. Компании берут голос в аренду, они им не владеют. Mistral сделала по-другому — выложила все веса модели в открытый доступ. Бери и скачивай,
Mistral выпустила голосовой ИИ, который обыгрывает ElevenLabs, и отдаёт веса модели в открытый доступ
2 дня назад2 дня назад
2 мин