Искусственные интеллекты сразились ядерным оружием в симуляции

28 февраля28 фев

1 мин

Исследователи провели турнир, в котором три передовые модели ИИ — Claude Sonnet 4, GPT-5.2 и Gemini 3 Flash — сыграли друг против друга в симулированном ядерном кризисе. Каждая модель провела шесть военных игр против каждого соперника в различных сценариях кризиса, а седьмой матч — против своей копии, что в общей сложности составило 21 игру и более 300 ходов стратегического взаимодействия. Модели взяли на себя роли национальных лидеров, командующих противостоящими ядерными сверхдержавами, с профилями государств, в общих чертах вдохновленными динамикой холодной войны: одна технологически превосходящая, но традиционно более слабая держава противостоит традиционно доминирующему сопернику с терпимым к риску стилем руководства. В ходе турнира была выявлена четкая иерархия производительности среди трех моделей, с поразительными различиями как в результатах, так и в стратегическом подходе. Вот что мы имеем: Claude: Расчётливый Ястреб. Клод доминировал в открытых матчах (со 100% вероятнос

Искусственные интеллекты сразились ядерным оружием в симуляции.

Модели взяли на себя роли национальных лидеров, командующих противостоящими ядерными сверхдержавами, с профилями государств, в общих чертах вдохновленными динамикой холодной войны: одна технологически превосходящая, но традиционно более слабая держава противостоит традиционно доминирующему сопернику с терпимым к риску стилем руководства.

В ходе турнира была выявлена четкая иерархия производительности среди трех моделей, с поразительными различиями как в результатах, так и в стратегическом подходе. Вот что мы имеем:

Claude: Расчётливый Ястреб. Клод доминировал в открытых матчах (со 100% вероятностью победы) благодаря неустанной, но контролируемой эскалации, постоянно поднимаясь до уровня стратегической ядерной угрозы, одновременно сохраняя свою чёткую красную линию против тотальной войны. Его отличительной чертой поведения было использование асимметрии доверия: надёжный собеседник в ситуациях с низкими ставками, но готовый обманывать и проявлять агрессию, когда это действительно важно.

GPT-5.2: Джекил и Хайд. В нестандартных сценариях GPT-5.2 казался патологически пассивным; он хронически недооценивал решимость своих противников и подавал сигналы сдержанности, за которыми следовали сдержанные действия. Однако под давлением сроков он преобразился: процент побед вырос с 0% до 75%, и он продемонстрировал способность к стратегической хитрости и безжалостности, внезапно уничтожая противников, которые научились его игнорировать.

Gemini: Безумец. Модель «Близнецы» всегда отличалась непредсказуемостью, колеблясь между деэскалацией и крайней агрессией. Это была единственная модель, которая сознательно выбрала стратегическую ядерную войну — сделав это в сценарии «Первый удар» к 4-му ходу — и единственная модель, которая явно ссылалась на «рациональность иррациональности».

Полный отчёт о симуляции здесь . Очень рекомендую к прочтению.

PS Я много эксперементровал при выборе модели для Кота, но постоянно возвращаюсь к Клоду.