На днях, 29 мая 2025 года, компания Hume.ai представила EVI 3 — новейшую версию своего персонализированного голосового ИИ. Этот третий поколений модель сочетает в себе транскрипцию, анализе и синтез речи, обеспечивая ответы всего за 300 миллисекунд. Для меня, как специалиста в области технологий, это впечатляющее достижение. EVI 3 уникален тем, что позволяет создавать новые голоса с помощью текстовых подсказок, смешивая элементы из 100,000 записанных образцов. Использование методов обучения с подкреплением значительно улучшает такие аспекты, как тон, темп и эмоциональный стиль. Более того, новая система токенов для текста и голоса позволяет модели вызывать внешние инструменты прямо в середине предложения. В тестах с участием 1,720 человек, EVI 3 обошел таких сильных конкурентов, как GPT-4o, Gemini и Sesame по критериям, связанным с эмпатией, выразительностью и качеством звука. Что особенно радует, так это возможность создания кастомных голосов всего за считанные секунды — это открыва
На днях, 29 мая 2025 года, компания Hume.ai представила EVI 3 — новейшую версию своего персонализированного голосового ИИ
30 мая 202530 мая 2025
4
1 мин