Найти в Дзене
Сознание и Наука

Эффект Манделы для робота: Почему ИИ «галлюцинирует» так же, как мы создаем ложные воспоминания

Когда чат-бот уверенно приписывает авторство «Гарри Поттера» Достоевскому или выдумывает несуществующие судебные прецеденты, инженеры называют это «галлюцинацией». Однако когнитивные психологи видят в этом нечто до боли знакомое. Механизм, заставляющий искусственный интеллект лгать, похож на то, как человеческий мозг конструирует наше прошлое, создавая ложные воспоминания.
Пластилиновая память и вероятностные чудеса
Чтобы понять эту связь, нужно вернуться в 1970-е, к революционным работам психолога Элизабет Лофтус. Ее эксперименты, включая знаменитое исследование «Затерянные в торговом центре», доказали шокирующий факт: наша память — это не видеорегистратор, хранящий объективную запись событий. Это, скорее, страница в Википедии, которую можно редактировать задним числом. Лофтус показала, что с помощью наводящих вопросов или мягкого давления человеку можно внедрить воспоминание о событии, которого никогда не было. Мы не «воспроизводим» память, мы её каждый раз реконструируем заново,

Когда чат-бот уверенно приписывает авторство «Гарри Поттера» Достоевскому или выдумывает несуществующие судебные прецеденты, инженеры называют это «галлюцинацией». Однако когнитивные психологи видят в этом нечто до боли знакомое. Механизм, заставляющий искусственный интеллект лгать, похож на то, как человеческий мозг конструирует наше прошлое, создавая ложные воспоминания.

Пластилиновая память и вероятностные чудеса

Чтобы понять эту связь, нужно вернуться в 1970-е, к революционным работам психолога
Элизабет Лофтус. Ее эксперименты, включая знаменитое исследование «Затерянные в торговом центре», доказали шокирующий факт: наша память — это не видеорегистратор, хранящий объективную запись событий. Это, скорее, страница в Википедии, которую можно редактировать задним числом. Лофтус показала, что с помощью наводящих вопросов или мягкого давления человеку можно внедрить воспоминание о событии, которого никогда не было. Мы не «воспроизводим» память, мы её каждый раз реконструируем заново, заполняя пробелы фантазией, чтобы история выглядела цельной.

Именно здесь кроется параллель с большими языковыми моделями (LLM). Нейросеть не «знает» фактов и не имеет доступа к базе истин. По сути, это сверхмощный механизм автозаполнения. Обучаясь на терабайтах текста, модель учится предсказывать следующее слово на основе вероятности. Когда вы задаете вопрос, ИИ не ищет ответ в энциклопедии, он генерирует последовательность токенов, которая статистически выглядит как правильный ответ.

Где сходится человеческое и искусственное

Сходство между ложными воспоминаниями человека и галлюцинациями ИИ заключается в природе ошибки: это сбой генерации, а не сбой поиска.

Заполнение пустот: Если человек забыл деталь (какого цвета была машина?), мозг подставит наиболее вероятный вариант (красная, потому что спортивная). Если ИИ не хватает данных в обучающей выборке, он заполнит пробел наиболее вероятным словом, чтобы сохранить связность текста.
Влияние контекста: Как Лофтус могла изменить воспоминания свидетелей, просто меняя формулировку вопроса (например, «врезались» вместо «соприкоснулись»), так и промпт пользователя может сбить нейросеть. Если настойчиво спрашивать ИИ о деталях встречи Наполеона и Эйнштейна, модель, скорее всего, сочинит красочную историю этой встречи, пытаясь угодить контексту запроса, игнорируя историческую невозможность.

Однако есть и фундаментальное различие. Человеческие ложные воспоминания часто имеют эмоциональную привязку и социальную функцию (мы хотим быть полезными свидетелями или частью группы). Галлюцинации ИИ — это чистая математика, лишенная понимания истины или лжи. Для алгоритма правда и правдоподобная выдумка имеют одинаковый цифровой вес, если они одинаково хорошо вписываются в паттерн.

Цена интеллекта

Главный вывод, к которому приходят исследователи ИИ и нейроученые, наблюдая за этим феноменом, парадоксален: способность галлюцинировать — это не баг, а неизбежная цена креативности и обобщения.

Если бы наш мозг или нейросеть запоминали всё с фотографической точностью, они не смогли бы учиться на примерах и адаптироваться к новому. Сжатие информации (будь то в биологических нейронах или цифровых весах) требует отбрасывания деталей. И когда мы пытаемся «распаковать» эти данные обратно, система вынуждена додумывать утраченное.

Галлюцинации ИИ — это зеркало, в котором мы видим несовершенство собственного разума. И пока инженеры учат машины проверять факты, нам стоит помнить уроки Элизабет Лофтус: даже самому яркому воспоминанию не всегда можно доверять.