Найти в Дзене
Цифровая Переплавка

♟️ Когда ИИ не выдержал: как модель o3 «вспотела» над задачей Поля Морфи

Оглавление

Недавно наблюдал за любопытным экспериментом: шахматная головоломка великого Поля Морфи, «мат в два хода», была поставлена перед одной из новейших разработок OpenAI — моделью o3. Удивительно, но модель вела себя совсем по-человечески: сомневалась, мучилась, искала пути решения и даже… не выдержала искушения, «подсмотрев» решение через интернет-поиск Bing. Как же так вышло?

🎲 Шахматная задача: что заставило ИИ задуматься?

Поль Морфи — гениальный шахматист XIX века, знаменит сложными комбинациями и яркими жертвами фигур. Его задача «мат в два хода» кажется простой, но только на первый взгляд. Перед моделью o3 стояла непростая задача:

Белые: Король (с8), Ладья (a1), Пешка (b6).
Чёрные: Король (a8), Слон (b8), Пешки (a7, b7).

Белые ставят мат в два хода.

Источник: https://alexop.dev/posts/how-03-model-tries-chess-puzzle/
Источник: https://alexop.dev/posts/how-03-model-tries-chess-puzzle/

Обычный шахматист сразу попробует несколько простых вариантов и быстро поймёт, что задача далеко не очевидна. Модель o3 пошла по аналогичному пути, но потом начала паниковать…

🔍 Как размышляла модель o3?

Оказалось, что поведение o3 впечатляюще напоминает поведение живого игрока:

🧐 Тщательный анализ доски

  • Сначала модель подробно проверила позиции всех фигур, убедившись, что верно поняла задачу.
  • «Король на c8, ладья на a1…», — тщательно перечисляла o3, словно стараясь убедить себя в правильности.

🤔 Первые попытки и сомнения

  • Она попробовала наиболее очевидные ходы, например взятие пешкой или ладьёй на a7.
  • Сразу же осознала ошибки в рассуждениях и призналась себе в неудаче:
    «Ход b7+ невозможен — пешка чёрных мешает».
    «Ход Rxa7+ не приводит к мату, так как после Bxa7 чёрный король не в шахе».

🐍 Неудачная попытка использовать Python

  • Потерпев неудачу в простом расчёте, модель попыталась «вычислить» правильный ход при помощи Python-кода.
  • Но неудачно: необходимый модуль не был доступен.

📐 Пиксельный анализ изображения

  • Отчаявшись, o3 перешла к совершенно неочевидной тактике — измерению клеток шахматной доски по пикселям!
  • «Клетка размером примерно 88 пикселей, значит, b7 находится на координатах…», — методично бормотала модель.

🌐 Почему ИИ сдался и полез в интернет?

В конце концов, спустя целых 8 минут размышлений, модель решила пойти по пути, знакомому любому современному школьнику, у которого не получается домашняя работа: обратиться за помощью к Bing.

🤖 «Честное» жульничество

  • o3 нашла форум, где подробно обсуждали именно эту шахматную задачу и узнала правильный ответ — ход ладьёй на a6.
  • Забавно, но даже получив ответ, модель не просто его приняла, а ещё раз проанализировала и подтвердила, что этот ход действительно ставит мат за два хода.

🚀 Почему это интересно?

Наблюдать, как модель ИИ настолько по-человечески пытается выйти из тупика, — бесценный опыт. Она не просто перебирает варианты, а ищет альтернативные подходы, пробует программирование, измеряет пиксели и, наконец, признаёт своё поражение, прибегая к внешним источникам. Это показывает, что современные ИИ:

  • 🧠 уже способны на многоступенчатые и «метакогнитивные» размышления;
  • 🛠️ пытаются использовать доступные инструменты;
  • 🧩 пока ещё не способны на полноценную творческую догадку, особенно в задачах с неочевидным решением («цугцванг»).

💡 Мнение автора статьи

На мой взгляд, подобные эксперименты крайне важны, так как показывают не только возможности современных моделей, но и чётко очерчивают их текущие границы. Современному ИИ отлично даются расчёты, логические построения и даже поиск нестандартных подходов. Но пока он ещё не научился полностью заменять творческую интуицию человека, хотя уже очень близок к этому.

Именно в таких задачах, как шахматы или сложные головоломки, становится понятным, где находится граница между разумом человека и мощью современных алгоритмов.

🔗 Ссылки по теме:

Подобные эксперименты помогают понять, как далеко продвинулись технологии и какие перспективы нас ждут. И, возможно, скоро мы увидим, как подобные модели уже не будут испытывать необходимость в «жульничестве», а полностью овладеют и творческим мышлением. Но до тех пор наблюдать за их попытками будет всё ещё чрезвычайно интересно.