Всем добра, эта заметка посвящена 8 марта. Женщинам особые поздравления.
На самом деле, я давно хотел рассказать о теории игр. Математической, конечно. Что же такое игра с точки зрения математики?
Это оптимизация в условиях конфликта интересов. То есть вот есть две функции, f(x,y) и g(x,y), а x и y из каких-то множеств. Один игрок выбирает х, другой у, а выигрыши у них задаются этими функциями. Понимаете? Твой выигрыш зависит не только от твоего выбора, но и от выбора противника, а у него другие интересы.
Простейший класс игр - матричные. Один игрок выбирает строку, другой выбирает столбец. Полученное число есть выигрыш одного и проигрыш другого.
И получается простая, но обидная штука: в строке могут быть очень вкусные значения, но получить их не получится. Правильное рассуждение другое: надо найти худшее значение в каждой строке и выбрать ту строку, в которой оно лучше. Это называется максимин. Противник будет искать минимакс. Максимин всегда меньше минимакса, либо равен ему. Иногда всё ясно и понятен выбор обоих, можно открыто говорить о своих предпочтениях. Вот пример:
2 1
3 -1
Это выигрыши того, кто выбирает строку, и проигрыши того, кто выбирает столбец. Минимумы по строкам: 1 и -1. Максимальный из них 1 в первой строке. Максимумы по столбцам 1 и 3. Минимальный из них тоже 1, во втором столбце. Выбирается первая строка и второй столбец.
И выбора по сути нет. Игрок "по столбцам" проигрывает, хотя выигрыш для него есть (-1). Просто он его не получит.
Основной вывод здесь: рассуждения "если бы не, то тогда бы не..." неверны изначально, если решение принимает кто-то еще.
Может получаться еще интереснее, когда нет оптимальных чистых стратегий, то есть однозначного выбора данной строки. Вот пример:
1 -1
-1 1
Если номер строки и столбца одинаков, я выиграл. Если нет, проиграл. Понятно, что я не могу выбирать всегда одну строку и вынужден хитрить. Причем я сам не знаю своего выбора: он принципиально случаен. Можно только посчитать вероятность, с которой надо выбирать строку (и для другого игрока вероятности выбора столбца) и средний выигрыш.
Вывод: в типичном случае решение принимается случайно.
Рассмотрим игры посложнее: биматричные. Отличие в том, что матриц теперь две. Один игрок выбирает номер строки, другой номер столбца, но выигрыши они берут из разных матриц. При этом их интересы уже не обязательно противоположны. И возможны интересные эффекты.
Классическим примером является дилемма заключенных. Два преступника имеют выбор: колоться или запираться. Если один сдает другого, крысу выпускают, второго сажают на 10 лет. Если оба раскалываются, получают 10 на двоих. Если оба молчат, получают по году за сопротивление при аресте.
Итак, оптимально для двоих отсидеть два года на двоих. Но это решение недоступно, поскольку каждый сравнивает варианты "сидеть год или не сидеть" (если партнер молчит) и "сидеть 10 или сидеть 5" (если партнер крыса). В любом случае выгоднее говорить. Причем партнеру это известно, и известно, что вам это известно, и так далее.
Чтобы заставить молчать, нужна сицилийская экзотика вроде омерта и вендетта, сообщники на воле, или повтор игры и накопление репутации. Это уже другие задачи.
Поучительный вывод: опять-таки, наличие хороших, очевидных, взаимовыгодных, но недостижимых решений. Вроде "почему нельзя всем жить дружно и не воевать".
Кстати, иногда добавляют, что чуваки сидят в разных камерах. Это неверно: они могут сидеть в одной и общаться. Всё равно выгодно предать, а в правилах игры нет никаких механизмов обеспечения честности.
Мы уже рассматривали игру с прятанием монеты. Один прячет монету в дублон или двойной дублон, другой угадывает. Если угадает, забирает монету, а если нет, то платит 1.5 дублона проигрыша. Кажется, что игра безобидная: средний выигрыш нулевой. Но нет, игра за того, кто прячет. Прятать надо дублон с вероятностью 7/12, и называть тоже. При этом средний выигрыш 1/24 дублона для того, кто прячет.
В самом деле, если вероятность дублона p (прятать) и q (называть), то средний выигрыш того, кто прячет, равен
E = -pq + 1.5p(1-q) + 1.5(1-p)q - 2(1-p)(1-q) = q(3.5-6p) + 3.5p - 2/
Если слишком часто выбирать дублон, противник будет называть всегда его (q=1) и выигрывать. Если слишком редко, то он будет называть всегда двойной (q=0) и тоже выигрывать. Равновесие определяется условием 6p=3.5, что и дает p=7/12 и E=1/24. От действий второго в среднем ничего тогда не зависит, но если он играет неправильно, можно улучшить результат. А правильно для него, из-за симметрии, точно так же.
Поучительный вывод здесь сами сделайте.
Ну и "семейный спор", она же "battle of the sехеs". Игроков двое, муж и жена, каждый независимо принимает решение "на футбол или к маме". Если оба решат одинаково, один получит много удовольствия, другой немного (но получит). Если же выберут разное, поссорятся и получат нули или даже минус.
Здесь решение в смешанных стратегиях: надо бросать кубик и принимать решение случайно. Можно только дать вероятности двух вариантов.
Здесь есть о чем поговорить, например, имеется переговорное множество: возможности обоим улучшить свой средний выигрыш, договорившись. Но есть принцип Штакельберга.
Его смысл прост: если жена крикнет "к маме и никаких дискуссий", то мужу придется выбирать между небольшим, но выигрышем, и ссорой. Получается, что имеется борьба за лидерство: кто первый крикнул, тот и поставил партнера в неудобное положение. И ему придется "идти на принцип", принимая локально неоптимальное, но выигрышное в среднем решение. Да еще и случайное.
Выводы опять-таки не навязываю, но по-моему, всё происходящее прекрасно объясняется этими общеизвестными примерами.
Ну и живите дружно в пределах своей семьи. Это более или менее в ваших руках. Хотя бы это.
Возможно, будет продолжение этой любопытной темы.