Найти тему
18 подписчиков

Исследователи Apple разрабатывают ИИ, который может «видеть» и понимать контекст экрана


Исследователи Apple разработали новую систему искусственного интеллекта, которая может понимать расплывчатые ссылки на объекты на экране, а также диалог и фоновый контекст, что обеспечивает более естественное взаимодействие с голосовым помощником, говорится в документе , опубликованном в пятницу.

Система, получившая название ReALM, использует большие языковые модели для преобразования сложных задач. Это позволяет ReALM добиться значительного улучшения производительности по сравнению с существующими методами.

Ключевым нововведением ReALM вляется использование анализируемых позиций объектов на экране. Исследователи продемонстрировали, что этот подход в сочетании с точно настроенной языковой моделью специально для эталонного разрешения может превзойти GPT-4 в решении этой задачи.

Исследователи Apple разрабатывают ИИ, который может «видеть» и понимать контекст экрана  Исследователи Apple разработали новую систему искусственного интеллекта, которая может понимать расплывчатые...
Около минуты