26,7 тыс подписчиков

Нечестная орлянка

1 марта 20241 мар 2024

163

3 мин

Игра в орлянку — неисчерпаемая тема. Давайте изучим случай несимметричной монеты: игрок выигрывает ставку с вероятностью p и проигрывает с вероятностью q=1-p. Изначально у игрока А ставок, у противника В ставок. И игра идет до разорения одного из игроков.

Начнем с вероятности выиграть. Обозначим ее Р(А) и посмотрим, как выражается P(n) для любого капитала n. По формуле полной вероятности, это P(n-1) при условии, что ставка будет проиграна, плюс P(n+1) при условии, что ставка будет выиграна. Это дает уравнение

P(n) = pP(n+1) + qP(n-1).

Скороговоркой повторяем общую теорию: решениями являются бесконечные последовательности P(n), сумма решений есть решение и "решение умножить на число" есть решение, то есть решения образуют линейное пространство. Размерность этого пространства равна двум, так как первые два члена последовательности определяют все остальные. Имея два независимых (непропорциональных) решения, можно сложить из их первых двух элементов любую пару вообще, а значит, и любое решение.

Надо найти два решения: через них получим все остальные.

Одно решение угадывается сразу: это P(n)=1. Но мы поищем решения в виде степени P(n)=λⁿ. Это приводит к уравнению для числа λ:

pλ² - λ + q = 0

Его дискриминант равен 1-4pq и он неотрицателен, так как равен (1-2p)². Получаем два разных (и независимых, то есть не сводимых одно к другому) решения: λ=1 и λ=q/p.

Граничные условия у нас P(0)=0, P(A+B)=1: если всё проиграл, то выиграть нет шансов, а если всё выиграл, то точно уже победил. Они позволят найти константы в формулу для общего решения:

P(n) = C₁ + C₂(q/p) ⁿ

Первое условие дает C₁+C₂=0, а второе довольно громоздкое. Получаем

Можно нарисовать график зависимости вероятности победы как функции n при разных р и разных А+В.

Очень любопытно, что графики с ростом/убыванием p очень быстро отдаляются от синей диагонали симметричного случая.

Минимальный капитал A, при котором вероятность победы больше ½, как видим, меняется весьма нелинейно:

Как видим, при "маленькой" вероятности выиграть, а "маленькая" это уже 45%, надо обладать львиной долей суммарного капитала (100), чтобы шансы выиграть были больше шансов проиграть. И наоборот, при небольшом перевесе в свою пользу можно тягаться даже с весьма состоятельным противником. Если шансы за вас 70% (не обязательно 99), то вы и с одной ставкой играете не хуже, чем на равных, против 99 ставок. Обратите внимание на разницу между 0.49 и 0.51!

Интересно посмотреть асимптотику: поведение этой вероятности при стремящемся к бесконечности В (капитал противника), при 2p>1 (монета в пользу игрока). Один корень равен 1, другой меньше единицы. В знаменателе формулы он уйдет в нуль, и получится вероятность выигрыша против бесконечного капитала:

P(n) = 1 - (q/p) ⁿ.

Если p=⅔, то q=⅓ и P(n)=1-(½)ⁿ. С десятью ставками можно (было бы) выходить против Казино с миллиардами в подвалах весьма уверенно: шанс разнести заведение больше, чем 99.9%.

Теперь посмотрим среднюю длину партии. При капитале n это N(n), и уравнение такое:

N(n) = 1 + pN(n+1) + qN(n-1).

Единичка "засчитывает" сделанный ход, а после этого просто добавляем все ходы после этого, в зависимости от нового капитала.

Решение этого уравнения надо угадать, хотя бы одно, а все остальные получатся добавлением решений однородного уравнения (без единички), которое мы уже решили. Решение угадывается без труда: это N(n)=-n/(p-q). В самом деле,

1 - p(n+1)/(p-q) - q(n-1)/(p-q) = 1 - n/(p-q) + (q-p)(p-q) = -n/(p-q) = N(n).

Общее решение (то есть все решения вообще) записано формулой

Граничные условия теперь N(0)=N(A+B)=0, так как когда кто-то выиграл, то игра кончилась. Первое условие опять дает C₁+C₂=0, а второе приводит к формуле

Среднее число ходов до конца игры в зависимости от начального капитала А (А+В=100 всегда) и разных вероятностей победы в одной игре: черная 0.5001, желтая 0.51, зеленая 0.6, голубая 0.9, красная 0.1, синяя 0.4.

Тот же график, но с увеличением по оси у. Интересен почти линейный рост/убыванием при вероятности, отличной от 0.5.

При очень больших В и 2p<1 (игра против игрока) получаем C₁=0 и

N(n) = n/(q-p).

То есть, среднее число игр до разорения (которое неминуемо) пропорционально начальному капиталу. Скажем, при p=⅓ получаем 3n. При p=½ получается бесконечность, но это за счет маловероятных длинных траекторий. Однако такие траектории и в случае нечестной игры тоже есть, поэтому реальная длина траектории еще меньше. К примеру, если p=⅓ и у вас одна ставка, то в 66% случаев вас уморщат на первом же ходу, а ещё в 15% — на третьем. Это совместно даёт 80%, а вот остальные 20 дают траектории подлиннее, и они-то, хоть и редкие, компенсируют типичный разгром с одного хода, обеспечивая среднее 3.

Ещё одно упрощение можно получить, если p>q и велико А. Тогда

C₁=(A+B)/(p-q) (асимптотически) и N(A)=-A/(p-q)+C₁,

что даёт N(A)=B/(p-q). В общем-то, это тот же результат, только с точки зрения другого игрока (счастливчика).

Можно сформулировать результат так: если "счастливчик" (тот, в чью пользу игра) имеет много ставок, то среднее число игр до разорения одного из игроков (чаще это, конечно, противник счастливчика) пропорционально капиталу несчастного и тем больше, чем меньше разность вероятностей.

Удачной игры, амичи миеи.

Каналы, на которые стоит подписаться!

Полтора инженера8 марта 2022

Научно-популярные каналы на Дзене: путеводитель

Новости популярной науки12 марта 2022

Оглавление рубрики "Вероятность и теория игр"

Блокнот математика30 марта 2021

Навигатор по каналу

Блокнот математика1 августа 2020