Найти тему
10,2 тыс подписчиков

📌Модель машинного обучения Ferret-UI от Apple


⏩Apple представила модель машинного обучения Ferret-UI для распознавания элементов пользовательского интерфейса. В исследовании компания отметила, что практически все доступные мультимодальные языковые модели плохо работают с интерфейсами. Нейросети не отличают кнопки от полей ввода и других элементов.

⏩Компания собрала большой датасет для обучения Ferret-UI, что значительно улучшило распознавание. Отмечается, что нейросеть превосходит не только открытые MLLM, но и GPT-4. Модель можно использовать для реализации новых функций доступности. К примеру, нейросеть сможет управлять мобильным устройством, опираясь на запросы пользователя.

📎Инженеры компании опубликовали исследование на портале Arxiv.

📌Модель машинного обучения Ferret-UI от Apple  ⏩Apple представила модель машинного обучения Ferret-UI для распознавания элементов пользовательского интерфейса.
Около минуты