1049 подписчиков

Теория игр

2 марта2 мар

148

14 мин

Представьте, что вы стоите в очереди за билетами на премьеру долгожданного фильма. Впереди вас — человек двадцать, а касса вот-вот закроется. Внезапно вы замечаете, что открылась вторая касса, и перед ней никого нет. Что делать? Бежать туда первым? Но если все остальные подумают так же, там мгновенно образуется толпа, и вы потеряете своё место в первой очереди. Остаться? Но тогда кто-то более решительный займёт выгодную позицию. В этот момент вы, сами того не осознавая, решаете задачу из области теории игр. Вы пытаетесь предугадать действия других людей и выбрать наилучшую стратегию с учётом их возможных решений. И точно такие же задачи — от выбора очереди до международной политики — математики научились решать с помощью строгих формул и доказательств. История теории игр неразрывно связана с именем Джона (Януша) фон Неймана — человека, которого современники называли величайшим умом XX века. Венгерский математик, эмигрировавший в США, обладал феноменальной памятью и способностью мыслит

Оглавление

Введение
Рождение теории игр
Конкурс красоты Кейнса

Введение

В этот момент вы, сами того не осознавая, решаете задачу из области теории игр. Вы пытаетесь предугадать действия других людей и выбрать наилучшую стратегию с учётом их возможных решений. И точно такие же задачи — от выбора очереди до международной политики — математики научились решать с помощью строгих формул и доказательств.

Рождение теории игр

История теории игр неразрывно связана с именем Джона (Януша) фон Неймана — человека, которого современники называли величайшим умом XX века. Венгерский математик, эмигрировавший в США, обладал феноменальной памятью и способностью мыслить одновременно в нескольких направлениях. Он внёс фундаментальный вклад в квантовую механику, создал архитектуру современных компьютеров, участвовал в Манхэттенском проекте — и при этом находил время размышлять о карточных играх.

Именно покер натолкнул фон Неймана на революционную идею. Он заметил, что в отличие от шахмат, где вся информация открыта, в покере приходится принимать решения в условиях неопределённости, учитывая не только свои карты, но и возможные действия соперников. Более того, иногда выгодно блефовать — то есть действовать вопреки логике, чтобы запутать противника.

В 1928 году фон Нейман опубликовал статью, в которой доказал теорему о минимаксе. Её суть в том, что в любой игре двух игроков с нулевой суммой (где выигрыш одного равен проигрышу другого) существует оптимальная стратегия. Следуя ей, игрок может гарантировать себе определённый результат независимо от действий соперника.

Но настоящий прорыв произошёл в 1944 году, когда фон Нейман вместе с экономистом Оскаром Моргенштерном опубликовал монументальный труд «Теория игр и экономическое поведение». Эта книга объёмом более шестисот страниц заложила фундамент новой научной дисциплины. Авторы показали, что экономические процессы можно рассматривать как стратегические игры, где участники стремятся максимизировать свою выгоду.

Что двигало фон Нейманом? Он был убеждён, что социальные науки нуждаются в такой же строгой математической базе, как физика. Экономисты того времени часто полагались на интуицию и общие рассуждения. Фон Нейман предложил инструмент для точного анализа — и этот инструмент оказался применим далеко за пределами экономики.

Конкурс красоты Кейнса

Чтобы понять, насколько глубоко теория игр проникает в нашу жизнь, обратимся к знаменитому примеру британского экономиста Джона Мейнарда Кейнса.

В 1936 году он описал газетный конкурс, участники которого должны были выбрать шесть самых красивых лиц из сотни фотографий. Победителем становился тот, чей выбор совпадал с мнением большинства.

Казалось бы, задача проста: выбирай тех, кто нравится тебе. Но подождите. Если вы хотите выиграть, вам нужно выбрать не самых красивых по вашему мнению, а тех, кого выберет большинство. Значит, нужно думать не о своих предпочтениях, а о предпочтениях других. Но ведь другие тоже рациональны и тоже понимают эту логику. Значит, они тоже будут пытаться угадать мнение большинства. И вы должны угадать, что они подумают о мнении большинства…

Этот бесконечный цикл рассуждений приводит к парадоксальному результату: победителями оказываются не объективно красивые лица, а те, которые выглядят «среднестатистически привлекательными» — такими, какими их представляет коллективное воображение.

Кейнс использовал этот пример для описания фондового рынка. Инвесторы покупают акции не потому, что верят в реальную стоимость компании, а потому, что ожидают роста цены — то есть предполагают, что другие инвесторы тоже захотят купить эти акции. Каждый пытается предугадать ожидания других, и реальная ценность актива отступает на второй план.

Именно такое мышление приводит к экономическим пузырям. Вспомним крах доткомов в 2000–2001 годах. Инвесторы вкладывали миллионы в интернет-компании без прибыли и внятной бизнес-модели. Почему? Потому что все остальные делали то же самое, и казалось, что акции будут расти вечно. Каждый думал: «Неважно, что компания не зарабатывает — главное, что другие готовы платить за её акции ещё больше». Пока однажды пузырь не лопнул, уничтожив триллионы долларов.

Теория игр объясняет механику таких катастроф: когда все участники рынка ориентируются не на фундаментальную стоимость, а на ожидания ожиданий других участников, система становится нестабильной. Достаточно небольшого толчка — и карточный домик рушится.

Игры с одновременными ходами

Теперь давайте разберёмся с базовыми понятиями теории игр. Представьте две кинокомпании — назовём их «Альфа» и «Омега». Обе планируют выпустить блокбастеры и выбирают между двумя датами: октябрь или декабрь. Каждая компания принимает решение независимо, не зная выбора конкурента.

Если обе выберут один месяц, им придётся делить аудиторию, и каждая заработает меньше. Если разойдутся по разным месяцам — обе получат максимум. Но есть нюанс: декабрь традиционно более прибыльный из-за праздничного сезона.

Такая ситуация называется игрой с одновременными ходами — её участники действуют одновременно, не имея информации о решениях друг друга. Для анализа подобных игр используется стратегическая форма, которая включает три элемента: список игроков, набор доступных стратегий для каждого и выигрыши при любой комбинации стратегий.

Выигрыши удобно представлять в виде платёжной матрицы. Для нашего примера она может выглядеть так:

Числа в скобках — прибыль в миллионах долларов: первое число для «Альфы», второе для «Омеги». Видно, что обеим выгодно разойтись, но при этом каждая предпочла бы занять декабрь. Возникает стратегическая напряжённость: как договориться без явной договорённости?

Платёжная матрица чрезвычайно полезна анализа. Она позволяет увидеть структуру игры целиком и найти оптимальные стратегии. Но чтобы понять, какой исход наиболее вероятен, нам понадобится концепция, предложенная другим гением математики.

Равновесие Нэша

Если фон Нейман заложил фундамент теории игр, то Джон Нэш возвёл на нём величественное здание. История его жизни настолько драматична, что легла в основу книги Сильвии Назар «Игры разума» и одноимённого фильма с Расселом Кроу, получившего четыре премии «Оскар».

Нэш родился в 1928 году в Западной Виргинии. Уже в детстве он проявлял незаурядные способности, хотя учителя считали его «отстающим» — он решал задачи своими методами, непонятными окружающим. В Принстонском университете молодой математик поразил профессоров своей интуицией и дерзостью мышления.

В возрасте всего 21 года Нэш написал диссертацию объёмом в 27 страниц, которая перевернула теорию игр. Он предложил концепцию равновесия для игр, где интересы участников не обязательно противоположны — то есть выигрыш одного не равен проигрышу другого.

Что же такое равновесие Нэша? Это набор стратегий — по одной для каждого игрока — при котором никто не может улучшить свой результат, в одностороннем порядке изменив свою стратегию. Иными словами, в равновесии каждый игрок делает лучшее, что может, с учётом действий остальных.

Гениальность этой концепции в том, что она описывает устойчивое состояние системы. Если игроки находятся в равновесии Нэша, ни у кого нет стимула отклоняться от своей стратегии. Это своеобразный «ментальный контракт» — точка, где ожидания всех участников согласованы.

Дилемма заключённых

Самый знаменитый пример в теории игр — дилемма заключённых. Представьте: два человека совершили преступление и были задержаны. Полиция разводит их по разным камерам и предлагает каждому сделку.

Правила просты:

Если оба молчат, каждый получает 1 год тюрьмы (улик недостаточно для серьёзного обвинения).
Если оба дают показания друг против друга, каждый получает 3 года.
Если один молчит, а другой даёт показания, молчун получает 10 лет, а предатель выходит на свободу.

Составим платёжную матрицу (числа означают годы заключения, поэтому чем меньше — тем лучше):

Как бы вы поступили? На первый взгляд, очевидно: если оба молчат, каждый получает всего год. Идеальная ситуация «выигрыш-выигрыш» (win-win)!

Но давайте рассуждать как рационально мыслящий заключённый. Я не знаю, что сделает мой сообщник. Рассмотрю оба варианта.

Если он молчит: мне лучше предать (выйду на свободу вместо года тюрьмы).
Если он предаёт: мне тоже лучше предать (3 года вместо 10).

Получается, что независимо от действий сообщника, мне выгоднее предать. Стратегия «предать» доминирует. И мой сообщник, будучи таким же рациональным, придёт к тому же выводу.

Результат? Оба предают, оба получают по 3 года. Это и есть равновесие Нэша в дилемме заключённых. Ни один не может улучшить свой результат, изменив стратегию в одиночку: если я вдруг замолчу, а он продолжит предавать, я получу 10 лет вместо 3.

Здесь кроется глубокий парадокс: индивидуально рациональное поведение приводит к коллективно иррациональному исходу. Если бы оба молчали, было бы лучше каждому. Но логика самосохранения толкает к предательству.

Дилемма заключённых — не абстрактная головоломка. Она описывает множество реальных ситуаций: гонку вооружений между странами, ценовые войны между компаниями, чрезмерную добычу природных ресурсов. В каждом случае индивидуальная рациональность ведёт к общему проигрышу.

Эффективность по Парето

Итальянский экономист Вильфредо Парето предложил элегантный критерий для оценки исходов игр. Ситуация называется Парето-эффективной, если невозможно улучшить положение одного участника, не ухудшив положение другого. Иными словами, это состояние, в котором все возможности взаимовыгодного улучшения уже исчерпаны.

Важнейший вопрос теории игр: всегда ли равновесие Нэша оказывается эффективным по Парето? Ответ — нет, и это одно из самых тревожных открытий дисциплины.

Вернёмся к дилемме заключённых. Равновесие Нэша здесь — взаимное предательство с исходом (3 года, 3 года). Но существует альтернатива: взаимное молчание с исходом (1 год, 1 год). При переходе от предательства к молчанию оба игрока выигрывают — значит, равновесие Нэша в этой игре не является Парето-эффективным. Именно этот разрыв между индивидуальной рациональностью и коллективным благом и делает ситуацию «дилеммой».

Рассмотрим еще один пример дилеммы заключенных — работу беспроводных сетей.

Когда два Wi-Fi-роутера или вышки сотовой связи используют одну частоту, их зоны покрытия накладываются, сигналы интерферируют, и скорость передачи данных падает. Каждое устройство может выбрать мощность передачи: высокую или низкую.

Числа — скорость передачи в мегабитах в секунду. Логика идентична дилемме заключённых: высокая мощность — доминирующая стратегия для каждого устройства, ведь она гарантирует лучший результат независимо от действий соседа. В равновесии Нэша оба роутера работают на высокой мощности, и каждый получает всего лишь 50 Мбит/с.

Но если бы оба работали на низкой мощности, скорость каждого составила бы 100 Мбит/с! Равновесие Нэша снова оказывается неэффективным по Парето.

Как выйти из ловушки? Если оба устройства принадлежат одной сети, администратор может принудительно установить низкую мощность — заставить их «сотрудничать». Современные роутеры имеют настройки, позволяющие устройствам координировать работу вместо конкуренции. Это технический аналог того, что в теории игр называется механизмом принуждения к кооперации — внешней силы, помогающей игрокам избежать ловушки дилеммы.

Битва полов

До сих пор мы рассматривали игры с единственным равновесием Нэша. Но что происходит, когда таких равновесий несколько? Классический пример — «Битва полов» — демонстрирует совершенно иной тип стратегической проблемы.

Представьте: Алиса и Боб — молодая пара, планирующая вечер. За завтраком они решают провести время вместе, но расходятся в предпочтениях: Алиса хочет пойти на танцы, Боб — на футбол. Они договариваются созвониться днём и определиться. Но — вот незадача — на телефонной станции происходит сбой. Каждый должен принять решение куда идти, не зная выбора другого.

Главное для обоих — быть вместе. Провести вечер порознь — худший исход для каждого.

Числа здесь отражают «счастье» участников. Алиса будет счастлива пойти на танцы (выигрыш 10), а футбол вызывает у неё куда меньше положительных эмоций (выигрыш 5). Боб — наоборот. Если они разойдутся (например, Боб уйдёт на футбол, а Алиса — танцевать одна), оба получают 0.

Логика простая: главная ценность этого вечера для обоих — не само мероприятие, а то, что они проведут время вместе. Танцы без Боба для Алисы — это просто танцы, без того смысла, ради которого она вообще хотела куда-то пойти. То же самое с Бобом на футболе без Алисы. Они оба заранее договорились провести вечер вместе — это была общая цель.

Если эта цель провалилась, не важно, где именно ты оказался: удовольствия нет, вечер потрачен впустую, ты сидишь и смотришь новостную ленту или короткие видео в телефоне.

Проверим равновесия Нэша:

«Танцевальное» равновесие (оба идут на танцы): Алиса получает 10, Боб — 5. Может ли кто-то улучшить позицию, изменив стратегию в одиночку? Если Алиса уйдёт на футбол, когда Боб пойдёт на танцы — она получит 0 вместо 10. Если Боб уйдёт на футбол, оставив Алису на танцах — получит 0 вместо 5. Никто не хочет отклоняться. Это равновесие Нэша.

«Футбольное» равновесие (оба идут на футбол): Алиса получает 5, Боб — 10. Аналогичная логика: никто не выигрывает от одностороннего отклонения. Тоже равновесие Нэша.

Оба равновесия, кстати, Парето-эффективны: чтобы сделать лучше Алисе (перейти от футбола к танцам), нужно сделать хуже Бобу, и наоборот.

Проблема координации

Вот в чём драма «Битвы полов»: концепция равновесия Нэша сама по себе не говорит, какое из двух равновесий реализуется. Оба стабильны, оба самосогласованы — но они несовместимы друг с другом.

Что произойдёт на практике? Вполне вероятно — координационная неудача. Алиса решит: «Боб знает, как я люблю танцы, он уступит» — и пойдёт танцевать. Боб подумает: «Алиса знает, как я люблю футбол, она уступит» — и пойдёт на матч. Результат? Оба проводят вечер порознь, оба несчастны. Теоретик игр назвал бы это не равновесным исходом — ни одно из возможных равновесий Нэша не реализовалось.

Американский экономист Томас Шеллинг, получивший Нобелевскую премию в 2005 году, посвятил карьеру изучению именно таких ситуаций. Он показал, что в играх с множеством равновесий решающую роль играют фокальные точки — исходы, которые по каким-то причинам кажутся «естественными» или «очевидными» обоим игрокам.

Например, если Алиса и Боб в прошлом всегда уступали друг другу по очереди, или если один из них утром сказал «мне сегодня особенно важно…», это создаёт фокальную точку. Культурные нормы тоже играют роль: в традиционном обществе могут ожидать, что один партнёр уступит другому.

«Битва полов» — не просто академическая абстракция. Она описывает множество реальных ситуаций: выбор технического стандарта конкурирующими компаниями, координацию международной политики, даже решение о том, по какой стороне дороги ездить. Во всех этих случаях есть несколько устойчивых исходов, и главная трудность — не найти равновесие, а скоординироваться на одном из них.

Ястребы и голуби

Теория игр нашла неожиданное применение в биологии. Британский биолог Джон Мейнард Смит адаптировал её для объяснения эволюции поведения животных.

Представьте популяцию животных, конкурирующих за ресурсы — территорию, пищу, партнёров. Каждая особь может следовать одной из двух стратегий:

Ястреб — всегда сражается. Если встречает другого ястреба, бьётся до победы или поражения, рискуя получить серьёзные травмы. Если встречает голубя — забирает ресурс без боя.

Голубь — избегает конфликта. При встрече с ястребом отступает. При встрече с другим голубем — делит ресурс поровну после ритуальной демонстрации.

Предположим, ресурс стоит 50 единиц, а травма в бою обходится в 100 единиц. Вот платёжная матрица:

Когда два ястреба дерутся, каждый с вероятностью 50% побеждает (получая 50) или проигрывает (теряя 100 на лечение). Средний выигрыш: 0,5 × 50 + 0,5 × (-100) = -25.

Какая стратегия лучше? Зависит от состава популяции.

Если все — голуби, появившийся ястреб будет процветать: он забирает весь ресурс без боя.
Если все — ястребы, появившийся голубь тоже выигрывает: он избегает травм, довольствуясь нулём вместо средних -25.

Эволюционное равновесие достигается при смешанной популяции, где обе стратегии приносят одинаковый средний выигрыш. Это объясняет, почему в природе мы наблюдаем и агрессивное, и уступчивое поведение — эволюция поддерживает баланс.

Модель «ястребов и голубей» применяют для анализа конфликтов в человеческом обществе: от уличных разборок до международных отношений. Она показывает, что чистая агрессия невыгодна в долгосрочной перспективе — слишком велики издержки конфликтов.

От теории к практике

Теория игр прошла путь от интеллектуальной забавы математиков до мощного инструмента анализа в экономике, политологии, биологии, компьютерных науках. Двенадцать Нобелевских премий по экономике присуждены за работы, связанные с теорией игр.

Аукционы частот для мобильной связи проектируются с учётом теории игр — и приносят казне миллиарды долларов. Алгоритмы рекомендаций в социальных сетях учитывают стратегическое поведение пользователей. Международные переговоры анализируются как многошаговые игры с множеством участников.

Но, возможно, главная ценность теории игр — в том, что она учит нас думать стратегически. Она напоминает: принимая решение, учитывай, что другие тоже думают. Она показывает, почему сотрудничество иногда так трудно достичь — и почему оно так ценно. Теория игр объясняет, как возникают социальные нормы и институты — механизмы, помогающие людям избежать ловушек вроде дилеммы заключённых.

А в следующей статье мы найдём применение теории игр в решении заданий 19, 20 и 21 ЕГЭ по информатике.

Алгоритм решения заданий 19-21 ЕГЭ по информатике. Часть 1

Информатика ЕГЭ | Шаг в будущее4 марта

<<< Последняя статья Следующая статья >>>

Наука

7 млн интересуются