Пушистый профессор разобрался, как простая игра объясняет структуру, динамику и исход конфликтов и сотрудничества — от ядерной войны до клещей.
Самая известная головоломка в теории игр – это "дилемма заключённого" – встречается повсеместно. Она проявляется в международных конфликтах, спорах между соседями и даже в развлекательных телешоу.
Выбор стратегии в этой игре предопределяет исход: будь то жизнь и смерть или победа и крах. В основе «дилеммы заключенного» лежит удивительный природный феномен – сотрудничество.
Давайте разберемся на примере реальной истории и сыграем в "дилемму заключённого".
Как "дилемма заключённого" помогла понять угрозу ядерной войны
В 1949 году американская разведка выяснила, что Советский Союз создал атомную бомбу. Напряженность между двумя странами резко возросла, вплоть до призывов нанести ядерный удар по Советскому Союзу, чтобы вернуть себе преимущество.
Математик Джон фон Нейман, один из создателей теории игр, задавался вопросом: почему бы не сбросить бомбу прямо сейчас? Ответ на этот вопрос был получен математиками, которые разработали игру - "дилемму заключённого". Данная игра отражала суть конфликта между США и СССР.
Сыграем в "дилемму заключённого"
Представьте, что банкир предлагает вам и ещё одному человеку сыграть друг против друга. У вас есть выбор: сотрудничать или предать. Теория игр предопределяет исход игры при вы определённых условиях:
Цель – получить как можно больше монет.
Что вы выберете?
Допустим, ваш соперник собирается сотрудничать. Если вы сделаете то же самое, получите 3 монеты. Но если вы предадите его, получите 5. Предательство кажется выгоднее.
А что, если соперник собирается предать вас? В этом случае, если вы будете сотрудничать, то не получите ничего. А вот если предадите первым, то получите хоть что-то.
Получается, что независимо от действий соперника, предательство – лучшая стратегия. Если второй игрок рассуждает так же, он придет к такому же выводу.
Но если оба предадут, то каждый получит по одной монете, а могли бы получить по три!
Схожая логика заставила США и СССР накопить тысячи ядерных боеголовок, достаточных для взаимного уничтожения. Вместо этого им следовало договориться и прекратить разработку этого оружия. Действия, направленные на защиту собственных интересов, ухудшили ситуацию для обеих сторон.
"Дилемма заключённого" в природе: пример с импалами
Оказывается, "Дилемма заключённого" встречается повсеместно. В африканских саваннах импалы страдают от клещей, которые вызывают болезни и даже смерть. Импалам необходимо избавляться от паразитов. Они чистят себя сами, но есть места, до которых не дотянуться. Им требуется помощь сородичей.
Но, помогая другим, импалы тратят ценные ресурсы: слюну, электролиты, время и внимание.
Под палящим солнцем Африки и в условиях постоянной угрозы хищников каждой импале выгоднее не помогать никому. Но в то же время каждая импала нуждается в помощи. Если они не запоминают другую импалу, и не воспринимают как "свою", то разумно никому не помогать – ведь ответной помощи не будет.
Но в реальной жизни "дилемма заключённого" всегда имеет перспективу - возможность выгоды (спасения) в будущем. Это меняет условия задачи. Если в "дилемму заключённого" играть много раундов подряд, то отказ от сотрудничества на данный момент времени заставит других в следующий раз поступить так же.
Так, какая же стратегия самая выгодная в долгосрочной перспективе?
Стратегия "Око за око" оказалась самой выгодной
В 1980 году политолог Роберт Аксельрод организовал компьютерный турнир по игре "дилемме заключённого". Участники самостоятельно должны были разрабатывать стратегии взаимодействия с соперником. Основная цель игры заключалась в том, чтобы набрать максимум очков в серии игр друг с другом.
К удивлению, победила простая стратегия "Око за око" ("Tit for Tat"), которая начиналась с сотрудничества, а затем повторяла предыдущий ход оппонента.
Аксельрод выделил четыре ключевых качества успешных стратегий.
Добро победило: стратегии, основанные на сотрудничестве, оказались более выгодными в долгосрочной перспективе, чем хитрость и агрессия "здесь и сейчас".
Эволюция стратегий и как мы пришли к пониманию цели и милосердию
Аксельрод разработал модель, имитирующую эволюцию стратегий: успешные стратегии получали преимущество, а провальные исчезали. В конечном итоге "добрые" стратегии, включая "Око за око", стабилизировались и стали лидерами.
В условиях реального мира, который не является идеальным, более "милосердные" версии "Око за око", способные прощать случайные предательства, показали лучшие результаты.
Однако важно понимать, что цель - не отобрать награду у соперника, а достичь такого результата, когда никто не останется в обиде.
Турниры Акселя Рода проводятся уже более 40 лет, и до сих пор исследуются вопросы оптимальных стратегий в различных обстоятельствах. Исследователи экспериментируют с разными условиями, схемами вознаграждения и учитывают различные ошибки. Даже допускаются мутации в стратегиях.
Конечно, стратегия "око за око" (или "Казаука") не всегда приводит к победе, но позволяет сохранить мир.