Найти в Дзене

На днях, 29 мая 2025 года, компания Hume.ai представила EVI 3 — новейшую версию своего персонализированного голосового ИИ

На днях, 29 мая 2025 года, компания Hume.ai представила EVI 3 — новейшую версию своего персонализированного голосового ИИ. Этот третий поколений модель сочетает в себе транскрипцию, анализе и синтез речи, обеспечивая ответы всего за 300 миллисекунд. Для меня, как специалиста в области технологий, это впечатляющее достижение. EVI 3 уникален тем, что позволяет создавать новые голоса с помощью текстовых подсказок, смешивая элементы из 100,000 записанных образцов. Использование методов обучения с подкреплением значительно улучшает такие аспекты, как тон, темп и эмоциональный стиль. Более того, новая система токенов для текста и голоса позволяет модели вызывать внешние инструменты прямо в середине предложения. В тестах с участием 1,720 человек, EVI 3 обошел таких сильных конкурентов, как GPT-4o, Gemini и Sesame по критериям, связанным с эмпатией, выразительностью и качеством звука. Что особенно радует, так это возможность создания кастомных голосов всего за считанные секунды — это открыва

На днях, 29 мая 2025 года, компания Hume.ai представила EVI 3 — новейшую версию своего персонализированного голосового ИИ. Этот третий поколений модель сочетает в себе транскрипцию, анализе и синтез речи, обеспечивая ответы всего за 300 миллисекунд. Для меня, как специалиста в области технологий, это впечатляющее достижение.

EVI 3 уникален тем, что позволяет создавать новые голоса с помощью текстовых подсказок, смешивая элементы из 100,000 записанных образцов. Использование методов обучения с подкреплением значительно улучшает такие аспекты, как тон, темп и эмоциональный стиль. Более того, новая система токенов для текста и голоса позволяет модели вызывать внешние инструменты прямо в середине предложения. В тестах с участием 1,720 человек, EVI 3 обошел таких сильных конкурентов, как GPT-4o, Gemini и Sesame по критериям, связанным с эмпатией, выразительностью и качеством звука.

Что особенно радует, так это возможность создания кастомных голосов всего за считанные секунды — это открывает новые горизонты для пользовательского опыта в таких сферах, как поддержка клиентов, тренировки по здоровью и игры. Демо-версия и мобильное приложение уже доступны, что, безусловно, спровоцирует интерес к технологии. Ожидается также API-доступ в ближайшие недели, а поддержка таких языков, как французский, немецкий, итальянский и испанский, добавляет еще больше возможностей.

Hume.ai, основанная в 2021 году бывшим исследователем DeepMind Аланом Коуэном, продолжает свой путь к созданию эмоционально осведомленного диалога. Ранее компания выпустила EVI 2 в 2024 году и систему Octave TTS в феврале 2025 года. Важно отметить, что предшествующее поколение EVI 2 имело стоимость около 0.072 доллара за минуту, но о ценах для EVI 3 пока не сообщается.

Такую технологию можно рассматривать как один из шагов к общему голосовому интеллекту, который, безусловно, будет востребован в ближайшие годы. Я уверен, что EVI 3 станет важным инструментом для бизнеса и специалистов.

Приглашаю вас поделиться своими мнениями о данном нововведении. Как вы думаете, изменит ли это наше взаимодействие с ИИ?

#HumeAI #EVI3 #ИскусственныйИнтеллект #ГолосовыеТехнологии