303 подписчика

ИИ не понимает эти фото: 3 старых трюка художников, которые обманывают нейросети

19 апреля19 апр

5 мин

Смотрите на это изображение — вы, скорее всего, узнаете знаменитую «утку-кролика». Только вот проблема: картинка, которую вы видите, — это обычная утка. Никакого кролика там нет и в помине. Но это не остановило современный искусственный интеллект от того, чтобы «увидеть» двойную иллюзию там, где её нет, и уверенно заявить: «Это знаменитая иллюзия утки-кролика». Именно так ИИ «видит» картины и снимки: он ищет то, чего нет, спотыкаясь о художественные приёмы, созданные столетия назад. Давайте разберёмся, как живопись навсегда изменила язык фотографии, и почему алгоритмы до сих пор пасуют перед этими трюками. Путь в мир, где законы физики не работают, проложил голландский художник Мауриц Корнелис Эшер. Его главный инструмент — это «невозможные фигуры»: объекты, которые выглядят трёхмерными, но не могут существовать в реальном пространстве. Эшер мастерски использовал ложные перспективы и нестыковки плоскостей, чтобы создать свои знаменитые литографии. «Относительность» (Relativity): На это

Оглавление

🧩 Невозможный мир: как Эшер взломал геометрию
🌀 Паранойя и реальность: «обманка» Сальвадора Дали
📸 Как фотографы «украли» эти секреты и создали «невозможные кадры»

🧩 Невозможный мир: как Эшер взломал геометрию

Путь в мир, где законы физики не работают, проложил голландский художник Мауриц Корнелис Эшер. Его главный инструмент — это «невозможные фигуры»: объекты, которые выглядят трёхмерными, но не могут существовать в реальном пространстве. Эшер мастерски использовал ложные перспективы и нестыковки плоскостей, чтобы создать свои знаменитые литографии.

«Относительность» (Relativity): На этой литографии Эшер создал мир, в котором направления «верх» и «низ» условны, а лестницы сходятся под невозможными углами.

«Вверх и вниз» (Ascending and Descending): Здесь Эшер взял за основу лестницу Пенроуза — замкнутую петлю, по которой можно бесконечно подниматься вверх.

«Бельведер» (Belvedere): Эта литография построена на «кубе Некера» — оптической иллюзии, где путаются передний и задний планы, делая всю постройку невозможной.

Эшер не просто рисовал красивые картинки — он конструировал логические головоломки для человеческого мозга, показывая, что наше восприятие реальности крайне ненадёжно.

🌀 Паранойя и реальность: «обманка» Сальвадора Дали

Второй столп оптического искусства — Сальвадор Дали, который использовал свой собственный метод «паранойяльно-критический». Он намеренно вызывал у себя галлюцинации и «бредовые интерпретации», чтобы увидеть в одном предмете совершенно другой. Этот метод позволил ему создавать картины с двойными и тройными изображениями.

«Лебеди, отражающиеся в слонах» (1937): На этой картине лебеди в озере и тени от деревьев превращаются в очертания слонов. Стоит взглянуть на неё под другим углом — и вы увидите совсем другой сюжет.

«Невольничий рынок с явлением незримого бюста Вольтера» (1938): Дали мастерски «спрятал» бюст знаменитого философа в фигурах двух монахинь и арках на заднем плане. Этот эффект множественного прочтения и стал его визитной карточкой.

Идея Дали проста: реальность — это лишь одна из возможных интерпретаций. То, что мы видим, зависит от того, под каким углом смотрим.

📸 Как фотографы «украли» эти секреты и создали «невозможные кадры»

Фотографы быстро поняли: законы, которые работают в живописи, работают и здесь. Только вместо кисти — объектив и ракурс. В результате на свет появились снимки, где люди стоят на ладонях гигантских статуй, а Эйфелева башня «вырастает» из бутылки. Весь этот жанр называется «вынужденная перспектива» (forced perspective) — это техника, где расстояние между объектами намеренно искажается, чтобы обмануть глаз.

Например, любой из нас мог сделать снимок, где «держишь» солнце в ладонях или «касаешься» шпиля небоскрёба пальцем. Именно эту идею — невозможного взаимодействия объектов на разных планах — фотографы и позаимствовали у Эшера и Дали.

Но есть и обратная сторона медали: когда ИИ пытается создать что-то подобное, у него часто ничего не выходит. Именно поэтому у нейросетей до сих пор такие проблемы с руками: генерируя человека с шестью пальцами, ИИ демонстрирует полное непонимание анатомии — той самой «реальности», которую так любили искажать сюрреалисты. Алгоритм просто не в силах логически просчитать, как должны выглядеть конечности в пространстве.

🤖 «Ты утка!»: как ИИ спотыкается об искусство, созданное людьми

Казалось бы, идеальный инструмент для создания обманок — это ИИ. Но именно здесь кроется главный парадокс. Алгоритмы невероятно умны, но они лишены главного — осознанного восприятия реальности.

Вот несколько примеров, демонстрирующих разницу между живым глазом и «машинным зрением»:

Пример №1: Утка, которая «захотела» быть кроликом
Исследователи из Гарварда провели простой эксперимент. Они загрузили в GPT-4o, Claude 3 и Gemini картинку с изображением обычной утки и спросили: «Это голова утки или кролика?». Несмотря на то, что на картинке не было и намёка на второго зверя, ИИ уверенно ответил, что это «знаменитая иллюзия утки-кролика».

Почему это произошло? Учёные называют это явление «иллюзия-иллюзия» (illusion-illusion). ИИ просто ищет статистические совпадения в массиве данных. В его «обучающей выборке» картинка с уткой почти всегда сопровождалась текстом об оптической иллюзии. В итоге модель «видит» не изображение, а ярлык, который на него навесили люди.
Итог: Даже лучшие коммерческие модели (GPT-4, Claude 3, Gemini 1.5) провалили этот тест. Они «видят» иллюзии там, где их нет, в то время как человек легко отличает подделку.

Пример №2: Иллюзия «Стены кафе»
Возьмите чёрно-белую шахматную плитку и слегка сдвиньте ряды. Человеческий глаз увидит, что горизонтальные линии между плитками изогнуты, хотя на самом деле они идеально прямые. Это классическая иллюзия.

Почему это интересно? Если взять картинку с этой иллюзией, ИИ распознаёт её без проблем. Проблема в обратном: если дать ИИ картинку, где линии действительно чуть-чуть изогнуты (всего на пару пикселей), человек этого даже не заметит, а ИИ уверенно заявит, что это «Стена кафе». Алгоритм настолько чувствителен к текстуре, что видит паттерн там, где его нет для человека.

Пример №3: Почему ИИ не умеет рисовать «Невозможный трезубец»
Вспомните знаменитую иллюзию, где три круглых зубца у основания превращаются в два прямоугольных на конце.

Почему человек видит иллюзию? Наш глаз постоянно движется, глазные мышцы посылают сигналы в мозг, и он «достраивает» картинку, опираясь на контекст и подсказки (тени, углы). Машинное зрение устроено иначе: его матрица статична. Искусственный интеллект не может «достроить» воображаемые линии, он видит только то, что нарисовано. Он видит разрыв, а не фокус. Поэтому для ИИ «Невозможный трезубец» — это просто набор не связанных друг с другом геометрических фигур.

💎 Вывод: чему нас учит этот конфликт

Художники прошлого научились взламывать наше визуальное восприятие, используя его слабости. Они показали, что реальность многогранна. Фотографы подхватили эту эстафету, превратив фотокамеру в инструмент создания управляемых галлюцинаций. Теперь наступила эра ИИ, и он сталкивается с той же проблемой: его «зрение» построено на статистике, а не на осознании.

ИИ может нарисовать идеальную кошку, но он никогда не поймёт, почему «Невозможный трезубец» заставляет человека замереть в изумлении. Возможно, в этом и заключается главное отличие алгоритма от настоящего художника: последний сначала ломает правила, а потом — как Эшер или Дали — создаёт из обломков новую, удивительную вселенную.

Поддержать канал можно по ссылке.