Исследователи Apple разработали новую систему искусственного интеллекта, которая может понимать неоднозначные ссылки на объекты на экране, а также разговорный и фоновый контекст, обеспечивая более естественное взаимодействие с голосовыми помощниками, говорится в документе, опубликованном в пятницу.
Система, получившая название ReALM (Эталонное разрешение как языковое моделирование), использует большие языковые модели для преобразования сложной задачи эталонного разрешения, включая понимание ссылок на визуальные элементы на экране, в задачу чисто языкового моделирования. Это позволяет ReALM добиться существенного повышения производительности по сравнению с существующими методами.
“Способность понимать контекст, включая ссылки, необходима для разговорного помощника”, - написала команда исследователей Apple. “Предоставление пользователю возможности задавать запросы о том, что он видит на экране, является важным шагом в обеспечении реальной работы голосовых помощников без помощи рук”. Дл