«Реальность — это всего лишь иллюзия, хотя и очень настойчивая.» — Альберт Эйнштейн (1879-1955)
Несколько месяцев назад я написал статью об аудиоиллюзии, известной как тоны Шепарда, впервые описанной в 1964 году известным когнитивным ученым и психологом Роджером Н. Шепардом (см. «Если бы Эшер создавал музыку»). В ходе исследования этой темы я познакомился с невероятной широтой и глубиной его работы.
Предыстория: Ментальная ротация
Шепард, который изучал физику в Стэнфордском университете и в 1955 году получил степень доктора психологии в Йельском университете, был увлечен человеческим восприятием — тем, как мы видим, слышим и понимаем окружающий нас мир. В 1950-х годах психология все еще в основном была сосредоточена на бихевиоризме, изучении наблюдаемого поведения, как это демонстрировали работы Ивана Павлова и Б.Ф. Скиннера.
Однако Шепард больше интересовался наукой о том, что происходит в наших головах. В 1958 году он присоединился к Bell Labs, где начал исследовать идею о том, что наше восприятие — это не просто пассивный процесс, а активный. Он понял, что информация, которую мы поглощаем, трансформируется, формируется и интерпретируется в соответствии с нашими знаниями и опытом. Одним из его значительных вкладов в когнитивную науку стала его работа по ментальной ротации.
В 1968 году Шепард стал профессором Стэнфордского университета и начал разрабатывать эксперименты, которые могли бы измерять нашу способность вращать объекты в нашем мысленном взоре. Эта работа, как предполагается, была вдохновлена сном, в котором он видел вращающиеся в пространстве трехмерные объекты. Это привело к его статье 1971 года в журнале Science под названием «Ментальная ротация трехмерных объектов», в которой он и его соавтор Жаклин Метцлер измерили время, которое потребовалось испытуемым для мысленной оценки эквивалентности пар кубоидных конструкций, проецируемых на плоскость.
В статье они установили линейную зависимость между видимым углом поворота объекта (относительно базовой позиции) и временем, которое потребовалось участникам исследования для определения, являются ли пары объектов идентичными. Таким образом, Шепард и Метцлер сделали первый шаг к достижению цели Шепарда — присвоить объективные данные фундаментально невидимому психологическому процессу. Если вам интересно, одно из заключений заключалось в том, что участники мысленно вращали объекты со скоростью около 60 градусов в секунду.
Иллюзия
К моменту публикации книг «Ментальные образы и их трансформация» (1982) и «Взгляды разума» (1990) Шепард уже глубоко понимал, как ум обрабатывает представления трехмерных объектов. Самая известная из его иллюзий из «Взгляды разума» — это его рисунок A2 под названием «Переворачивающиеся столы». Вот воспроизведение этой иллюстрации:
Изображение показывает два стола в перспективе. Левый стол явно выглядит длиннее и уже, чем правый. Поразительная истина: четырехугольники, образующие поверхности столов, идентичны.
«Как это возможно?» — кричит ваш ум, когда ваши глаза перемещаются между столами, пытаясь примирить эту абсурдную информацию. Как объясняет Шепард в своей книге, это не просто визуальный трюк — иллюзия говорит о чем-то важном, по его словам, о «фундаментальных принципах восприятия», которые возникли за миллионы лет естественного отбора.
(Примечание: поверхности столов часто описываются как параллелограммы, но это не так. Я использовал программу ImageJ, чтобы подтвердить, что, в лучшем случае, это трапеции. Сам Шепард называет их просто «четырехугольниками».)
Как это возможно
На протяжении большей части развития человечества наше выживание зависело от способности точно воссоздавать трехмерный мир из двухмерной проекции этого мира на наши сетчатки. Этот механизм интерпретации эволюционировал до полной автоматизации и в значительной степени вне нашего сознательного контроля, независимо от того, является ли входными данными естественный мир или плоский лист бумаги.
В отличие от этого, способность человека изображать трехмерный объект в виде двухмерного рисунка, по-видимому, является относительно недавним навыком. Самый древний известный пример — это 45 500-летняя индонезийская наскальная живопись, изображающая свинью.
Потребовалось еще 44 000 лет, чтобы была изобретена перспектива в живописи. Один из ранних примеров — картина великого художника Ренессанса Мазаччо под названием «Деньги подать» (ок. 1426–27 гг.).
Я подозреваю, что с эпохи Возрождения, с появлением перспективы в искусстве, за которым последовало распространение компьютерной графики и теперь виртуальной реальности, эта естественная предрасположенность наших автоматических схем обработки изображений только усилилась, поскольку нас постоянно учат, что в некоторых случаях 2D ничем не отличается от 3D. Для плоского рисунка, который соответствует правилам линейной перспективы, глубина и световые подсказки слишком убедительны, чтобы их игнорировать.
«Переворачивающиеся столы» полагаются на восприятие глубины вместе с нашей способностью понимать трехмерное вращение. Когда мы видим изолированный квадрат, поворачивающийся от нас, его можно увидеть таким образом, но также легко представить его как форму с тремя сторонами разной длины, или мутирующий четырехугольник, наклоняющийся и погружающийся в страницу под углом.
Как только мы добавляем перспективу, контекст и немного света, становится трудно не видеть квадрат, который сохраняет свои размеры при повороте назад. Интересно, что мы воспринимаем эту версию как квадрат, даже несмотря на то, что ни одна из проекций на самом деле не является прямоугольной.
Точно так же, глядя на «поверхность стола», которая находится в плоскости x-y и вращается вокруг оси z в контексте ограничивающего ящика, мы интуитивно чувствуем, что ее стороны остаются постоянными по длине, хотя их проекционные длины на плоскости экрана постоянно меняются.
В частности, иллюзия Шепарда использует визуальный сигнал, известный как сетчаточный размер — физический размер изображения объекта на сетчатке. Подсказки о глубине говорят нам, что длинная ось стола слева уходит назад и вдаль от нас. С другой стороны, длинная ось стола справа, кажется, почти перпендикулярна нашей линии зрения.
Тем не менее, сетчаточный размер поверхностей столов одинаков. Если левый стол простирается назад, то его сетчаточный размер интерпретируется как укороченный. Наш мозг приходит к очевидному выводу, что его «фактическая» длина должна быть больше, чем у стола справа. И наоборот, ширина правого стола должна быть больше, чем у его соседа.
Я считаю, что то, что делает эту иллюзию такой мощной, заключается в том, что, в отличие от многих убедительных визуальных трюков (например, «Расфокусировка» Акиёши Китаоки), здесь легко понять, что происходит — но это знание не меняет наше основное убеждение в точности того, что мы видим.
Наследие Шепарда
Роджер Шепард был не просто когнитивным ученым. Он был также художником, музыкантом, фотографом и поэтом — по сути, творческой личностью. Его героями были не только Ньютон и Эйнштейн, но также Эшер и Магритт. Его творчество проникало в его исследования и открытия, от многомерного шкалирования до ментальной ротации, музыкального восприятия и универсального закона обобщения, который объясняет, как животные могут экстраполировать из известных ситуаций на новые.
В 1995 году Шепард был удостоен престижной Национальной медали науки. В его наградном цитировании говорится:
«За его теоретическую и экспериментальную работу по выяснению того, как человеческий разум воспринимает физический мир и почему человеческий разум эволюционировал так, чтобы представлять объекты именно таким образом; и за придание цели области когнитивной науки и демонстрацию ценности применения идей многих научных дисциплин к решению научных проблем.»
С начальной школы Шепард часто рисовал то, что ему снилось, иногда получая выговор за рисование на уроках. Некоторые из этих рисунков позже стали иллюстрациями в «Взгляды разума». На протяжении всей своей жизни он, похоже, умело и легко переходил от искусства к науке, от снов к реальности, стремясь найти смысл и механизмы того, как мы воспринимаем мир. Мы все стали богаче благодаря его радостным путешествиям разума.