Добавить в корзинуПозвонить
Найти в Дзене
Нейрозона сегодня

Grok Voice Agent API от xAI: Голосовой AI нового поколения

Компания xAI, основанная Илоном Маском, представила Grok Voice Agent API – новый инструмент для разработки голосовых ассистентов с функцией двустороннего голосового общения. API, разработанный на собственной архитектуре, отличается низкой задержкой ответа – менее 1 секунды – что обеспечивает высокую скорость работы голосовых интерфейсов. Ключевым преимуществом Grok Voice Agent API является возможность интеграции с внешними инструментами, включая веб-поиск и телефонию через SIP. Модель поддерживает более 100 языков, что делает её удобной для глобального применения. В ходе тестирования Big Bench Audio, Grok показал точность 92,3%, опередив конкурентов, таких как Gemini 2.5 Flash и GPT Realtime, и заняв первое место. Одним из главных достоинств нового API является его ценовая политика. Стоимость использования составляет $0,05 за минуту, что существенно ниже цен на аналогичные сервисы от OpenAI и ElevenLabs. Это делает Grok Voice Agent особенно привлекательным для компаний и разработчиков,

Компания xAI, основанная Илоном Маском, представила Grok Voice Agent API – новый инструмент для разработки голосовых ассистентов с функцией двустороннего голосового общения. API, разработанный на собственной архитектуре, отличается низкой задержкой ответа – менее 1 секунды – что обеспечивает высокую скорость работы голосовых интерфейсов.

Ключевым преимуществом Grok Voice Agent API является возможность интеграции с внешними инструментами, включая веб-поиск и телефонию через SIP. Модель поддерживает более 100 языков, что делает её удобной для глобального применения. В ходе тестирования Big Bench Audio, Grok показал точность 92,3%, опередив конкурентов, таких как Gemini 2.5 Flash и GPT Realtime, и заняв первое место.

Одним из главных достоинств нового API является его ценовая политика. Стоимость использования составляет $0,05 за минуту, что существенно ниже цен на аналогичные сервисы от OpenAI и ElevenLabs. Это делает Grok Voice Agent особенно привлекательным для компаний и разработчиков, стремящихся к внедрению голосовых интерфейсов без значительного увеличения расходов.

API позволяет создавать голосовых ассистентов, способных к контекстному пониманию и поддержанию осмысленного диалога, а также к автоматизации задач через интеграцию со сторонними сервисами. xAI планирует дальнейшее развитие экосистемы Grok, расширение функциональности и языковой поддержки, а также предоставление разработчикам полной документации и SDK.

С запуском Grok Voice Agent API xAI подтверждает, что голосовые технологии становятся быстрее, точнее и доступнее, открывая возможности для широкого внедрения speech-to-speech решений в различных приложениях, продуктах и корпоративных системах.