Найти в Дзене
ВЕДОМОСТИ

Ограничения ИИ: что человек умеет лучше нейросетей

Несмотря на стремительный прогресс больших языковых моделей, таких как GPT-4 или Gemini, существует пласт понятий, который ИИ по-прежнему интерпретирует хуже человека. Как показало новое исследование, опубликованное в Nature Human Behaviour, искусственный интеллект испытывает затруднения при работе с концептами, связанными с сенсорным опытом. Например, с понятием «цветок». Главная причина — отсутствие у ИИ органов чувств. В отличие от человека, модели машинного обучения не обладают ни зрением, ни обонянием, ни осязанием. А значит, не могут накапливать сенсомоторный опыт. Это ограничивает их способность формировать полноценное представление о физических объектах, даже если они обучены на огромных текстовых и визуальных массивах данных. «Большая языковая модель не может почувствовать запах розы, прикоснуться к лепесткам ромашки или пройти по полю с дикими цветами», — поясняет автор исследования Цихуэй Сюй, психолог и постдокторант Университета штата Огайо. В исследовании принимали участ
Оглавление
Фото: сгенерировано AI
Фото: сгенерировано AI

Несмотря на стремительный прогресс больших языковых моделей, таких как GPT-4 или Gemini, существует пласт понятий, который ИИ по-прежнему интерпретирует хуже человека.

Как показало новое исследование, опубликованное в Nature Human Behaviour, искусственный интеллект испытывает затруднения при работе с концептами, связанными с сенсорным опытом. Например, с понятием «цветок».

Главная причина — отсутствие у ИИ органов чувств. В отличие от человека, модели машинного обучения не обладают ни зрением, ни обонянием, ни осязанием. А значит, не могут накапливать сенсомоторный опыт. Это ограничивает их способность формировать полноценное представление о физических объектах, даже если они обучены на огромных текстовых и визуальных массивах данных.

«Большая языковая модель не может почувствовать запах розы, прикоснуться к лепесткам ромашки или пройти по полю с дикими цветами», — поясняет автор исследования Цихуэй Сюй, психолог и постдокторант Университета штата Огайо.

Как тестировали ИИ и людей

В исследовании принимали участие как люди, так и четыре языковые модели: GPT-3.5 и GPT-4 (OpenAI), PaLM и Gemini (Google). Испытуемым и алгоритмам предлагалось оценить 4442 слова по двум психолингвистическим шкалам:

Glasgow Norms — измеряет эмоциональные параметры (вовлеченность, доминирование, узнаваемость и др.);

Lancaster Norms — оценивает сенсорные характеристики слов (визуальные, обонятельные, тактильные и т. д.).

Вопросы были примерно такие: насколько «цветок» вызывающее эмоции или легко представимое слово (Glasgow) или как он ощущается при прикосновении, насколько ярко выражен запах (Lancaster).

Результаты показали, что языковые модели сравнительно точно интерпретируют абстрактные понятия вроде «справедливость», но демонстрируют значительные отклонения при попытке смоделировать восприятие физических объектов. Особенно это заметно в случае слов, ассоциирующихся с запахами, прикосновениями, визуальной или аудиальной насыщенностью — таких как «цветы», «шерсть» или «музыка».

Слово не заменит ощущение

По мнению авторов, понятие «цветок» для человека — это не просто объект, а узел ассоциативного сенсорного опыта. Зрение, осязание, обоняние и даже эмоциональные реакции соединяются в единую когнитивную структуру. Для ИИ, лишенного телесности, такая интеграция недоступна.

«Человеческий опыт неизмеримо богаче того, что можно выразить словами», — подчеркивает Сюй.

Исследование показало, что модели, обученные не только на текстах, но и на изображениях, лучше справляются с визуальными концептами. Это указывает на важность мультимодальных подходов в развитии ИИ — и, возможно, на будущее, в котором сенсомоторные данные от роботов будут интегрированы в обучение моделей.

Выводы и перспективы

Хотя технологии приближаются к уровню «умного» взаимодействия, различия между человеческим и машинным пониманием остаются принципиальными. Исследование поднимает важный вопрос: насколько глубоким может быть понимание вещей без тела, без чувств, без опыта?

Ответ, по крайней мере пока, очевиден: человек все еще превосходит ИИ в осмыслении физического мира — особенно когда дело касается не логики, а живого восприятия.

Подпишитесь на «Ведомости» в Telegram

Читайте также

Фото. Лос-Анджелес охватили массовые беспорядки

Что известно о беспорядках в Лос-Анджелесе

Как снижение ключевой ставки повлияет на бизнес и рубль

Платежи переходят на личности

Дачникам разъяснили требования по установке заборов