Разработчики из xAI представили расширенные возможности своего ИИ-собеседника Grok. В числе нововведений — визуальный модуль Grok Vision и голосовой режим, создающие новые сценарии взаимодействия с окружающим пространством. Инструмент умеет воспринимать происходящее через камеру смартфона и озвучивать свои выводы, обрабатывая изображение и подавая ответ сразу, не заставляя ждать. Функция визуального восприятия уже начала работу на устройствах под управлением iOS. Владельцы iPhone могут просто навести камеру на предмет, чтобы получить объяснение от голосового ассистента. При этом ответ озвучивается с учётом ситуации, что делает взаимодействие живым и реалистичным. Вариант для Android пока недоступен, но разработчики уверяют, что вскоре новинка появится и там. Помимо работы с изображением, голосовой режим теперь может понимать речь на разных языках, открывая возможности для общения с пользователями по всему миру. Поддержка многоязычного звука расширяет аудиторию и делает Grok инструменто