Найти в Дзене

Ученые обнаружили признаки деменции у современных нейросетей

Революционное исследование израильских ученых поставило под сомнение истинные возможности искусственного интеллекта. Специалисты из ведущих университетов Израиля применили к современным ИИ-системам стандартный тест на деменцию, используемый в медицинской практике, и получили неожиданные результаты. Исследовательские команды Еврейского университета в Иерусалиме и Тель-Авивского университета провели масштабное тестирование популярных нейросетей, включая ChatGPT и Google Gemini, используя Монреальский когнитивный тест (MoCA). Этот диагностический инструмент широко применяется для выявления когнитивных нарушений у людей, оценивая память, внимание, пространственное мышление и другие важные функции мозга. Результаты тестирования оказались тревожными: даже самые современные версии искусственного интеллекта продемонстрировали признаки, характерные для людей с деменцией. Особенно заметными оказались проблемы с визуально-пространственным восприятием. Например, при выполнении казалось бы простог
Фото: DALL-E 3
Фото: DALL-E 3

Революционное исследование израильских ученых поставило под сомнение истинные возможности искусственного интеллекта. Специалисты из ведущих университетов Израиля применили к современным ИИ-системам стандартный тест на деменцию, используемый в медицинской практике, и получили неожиданные результаты.

Исследовательские команды Еврейского университета в Иерусалиме и Тель-Авивского университета провели масштабное тестирование популярных нейросетей, включая ChatGPT и Google Gemini, используя Монреальский когнитивный тест (MoCA). Этот диагностический инструмент широко применяется для выявления когнитивных нарушений у людей, оценивая память, внимание, пространственное мышление и другие важные функции мозга. Результаты тестирования оказались тревожными: даже самые современные версии искусственного интеллекта продемонстрировали признаки, характерные для людей с деменцией. Особенно заметными оказались проблемы с визуально-пространственным восприятием. Например, при выполнении казалось бы простого задания — нарисовать часы с определенным временем — нейросети создавали искаженные, нелогичные изображения. Наиболее успешной оказалась модель ChatGPT 4o, набравшая 26 баллов из 30 возможных, что, тем не менее, указывает на наличие легких когнитивных нарушений. Другие системы показали еще более низкие результаты: ChatGPT 4 и Claude 3.5 Sonnet получили по 25 баллов, а Google Gemini 1.0 продемонстрировала серьезные нарушения, набрав всего 16 баллов. Исследование выявило и другие существенные недостатки ИИ-систем. В частности, нейросети продемонстрировали полное отсутствие эмпатии и неспособность распознавать потенциально опасные ситуации на изображениях. Вместо этого они механически описывали видимые детали, игнорируя контекст и возможные риски. Эти открытия имеют серьезные последствия для будущего применения ИИ в различных сферах. Особенно важны эти выводы для медицины и психологии, где точность восприятия и способность к комплексной оценке ситуации являются критически важными. Примечательно, что несмотря на выявленные недостатки, нейросети продолжают демонстрировать впечатляющие результаты в других областях, таких как обработка данных, решение математических задач и создание текстов. Это указывает на необходимость дальнейшего совершенствования ИИ-систем для достижения более сбалансированного развития их возможностей.