Найти тему
90 подписчиков

Ученые из Института информационных наук Университета Южной Калифорнии тестируют когнитивные способности продвинутых моделей искусственного интеллекта 🤖. Их интересует, способны ли эти модели решать визуальные головоломки и выполнять абстрактные рассуждения 🧩. Они использовали мультимодальные языковые модели (MLLM) для проверки, могут ли они справляться с невербальными абстрактными задачами, требующими как визуального восприятия, так и логического рассуждения.


Исследование показало, что модели с открытым кодом столкнулись с серьёзными трудностями в этих задачах 😅, тогда как закрытые модели, такие как GPT-4V, продемонстрировали лучшие результаты благодаря более продвинутым ресурсам для обучения 🚀. Команда протестировала 24 различные модели на головоломках, основанных на Прогрессивных матрицах Равена, известном тесте абстрактного мышления.

Многие модели не могли эффективно рассуждать, даже когда им предоставлялись детальные текстовые описания изображений 📜. Это показало, что проблема заключалась не только в визуальной обработке, но и в самом процессе рассуждения 🤔.

Для улучшения способностей ИИ в рассуждении исследователи внедрили метод "Постановка цепочек размышлений", при котором ИИ предлагается мыслить пошагово при выполнении задач. Этот подход позволил добиться значительных улучшений в некоторых случаях, увеличив эффективность до 100% 📈.

Исследование подчеркивает как текущие ограничения ИИ, так и захватывающие перспективы будущих достижений. Оно предоставляет понимание того, где ИИ испытывает трудности, и как может быть улучшена его эффективность при помощи наводок и корректировки фокуса 🎯. Это исследование стремится прокладывать путь к созданию ИИ, который не только понимает, но и умеет рассуждать, стирая границы между машинным интеллектом и человеческим мышлением 🌟.

#neuroco #нейроконтент #машинноеобучение #языковыемодели #нейросеть #нейронка #ArtificialIntelligence
1 минута