Найти тему
Блокнот математика

Парадокс двух конвертов и сюрприз неопределенности

Давайте разберем парадокс двух конвертов, хотя он довольно известен. Вам дают два конверта с деньгами и возможность открыть один из них. Открыв и пересчитав деньги, вы узнаете, что суммы в конвертах отличаются вдвое. То есть, в другом конверте либо в два раза больше, либо в два раза меньше, чем у вас в руках. И вы можете передумать, взяв другой конверт и заплатив маленькую неустойку.

Только вместо пилюль - конверты. Можно открыть, посмотреть и передумать.
Только вместо пилюль - конверты. Можно открыть, посмотреть и передумать.

Можно рассуждать так: У вас в руках Х, решение сохранить эту сумму даёт выигрыш Х со стопроцентной вероятностью. Решение попробовать другой конверт дает равновероятно 2Х и ½Х, то есть Х+¼Х, что больше Х. Получается, что стоит попробовать другой конверт и можно даже заплатить до четверти имеющейся в руках суммы. Например, 13%.

Но позвольте, ведь открытие конверта не дало никакой информации! У нас равновероятно минимум и максимум. Менять конверт после открытия — то же самое, что до открытия, что поменялось-то? Сам выбор конверта может включать в себя многочисленные передумывания, что добавляет узнавание суммы в одном из них? Ведь цель — взять максимум, сами суммы роли и не играют.

В этом и парадокс. Два вроде бы правильных рассуждения дают разные ответы.

На самом деле, первое рассуждение ошибочно, хотя это в глаза не бросается. Правильное такое: обозначим минимум из двух через М; тогда вы, открыв конверт, видите либо М, либо 2М. Решение "синица в руке" дает вам равновероятно эти два числа, то есть 1.5М в среднем. Решение "журавль в небе" дает вам равновероятно либо 2М, либо М, то есть те же 1.5М в среднем. При бесплатном передумывании вы ничего не выигрываете и не теряете; при платном вы безусловно проигрываете.

В чём же ошибка первого рассуждения? В том, что мы считаем известным относительно Х. А известным мы считаем два несовместимых свойства: Х любое положительное число (может быть счетное множество чисел, но уходящее в бесконечность, например, всевозможные целые степени двойки) и Х равномерно распределено.

А это невозможно.

Сумма вероятностей равна единице, если слагаемых бесконечно много, то равными они быть не могут, никакое значение не подходит. В случае непрерывного равномерного распределения плотность его постоянна от нуля до бесконечности, но имеет равный единице интеграл, что тоже невозможно. Никак.

Если же распределение неравновероятно, то Х, 2Х и ½Х могут иметь разные вероятности. И будут иметь разные, если Х достаточно велико. В этом случае игра совсем другая.

Прочие рассуждения свободны от этого предположения. В один конверт сумма может выбираться как угодно, а потом бросается монета и в другой конверт закладывают либо вдвое, либо вполовину. Но игрок этого не знает, и это принципиально.

Например, в первый выбирается любая сумма до 100 рублей, равновероятно. Если мы это знаем, то, увидев больше ста, точно знаем, что это максимум. Впрочем, увидев больше 50 — тоже.

Это идею можно развить дальше. Пусть у нас в конвертах вообще любые числа X и Y, положительные или отрицательные, никак не связанные. Нам надо выбрать большее: если угадали, выигрываем сто рублей.

Ну так мы выберем себе "убеждения" (можно их менять от игры к игре) Z и берем конверт, если там больше Z. Если меньше, меняем; менять можно только один раз, конечно.

Есть какие-то неизвестные нам вероятности трех событий: оба числа меньше Z, оба больше и одно больше, другое меньше. Сумма этих трех вероятностей равна единице и они неотрицательны: больше про них ничего неизвестно.

В первых двух случаях мы можем как выиграть, так и проиграть, равновероятно. Выигрыш равен 50 руб. Но вот в третьем случае мы выигрываем точно, ведь мы отринем минимум и согласимся на максимум. В итоге получаем средний выигрыш 50P₁+50P₂+100P₃=50+50P₃>50. Причем если плотность распределения строго положительна, то и неравенство строгое.

Насколько велик может быть выигрыш по сравнению со средним в 50 руб?

Пусть, для примера, одно число всегда очень близко к 100, а второе распределено с функцией распределения F(x). Тогда вероятность, P₃ равна сумме двух: что второе число меньше Z<100, и что оно больше Z>100. В первом случае вероятность равна F(Z), во втором 1-F(Z).

Какое же Z лучше выбрать? Если меньше 100, то чем больше, тем лучше, так что Z=100 оптимально и дает P₃=F(100). Если же больше, то чем меньше, тем лучше, что опять-таки дает оптимальное Z=100 и P₃=1-F(100).

Так что если чаще выпадает меньше 100, то лучше брать чуть больше 100, а если чаще выпадает больше ста, то лучше стоять чуть левее. Что и понятно. Максимальная вероятность равна максимуму из F(100) и 1-F(100), что точно больше ½ и может быть сколь угодно близко к 1. Например, если второе число всегда меньше 97, а первое близко к 100 (в интервале от 99 до 101), то стоит выбрать Z=98 и выигрывать вообще всегда.

Но это если есть информация...

А если ее нет, то просто получается странная вещь: мы ничего не знаем, но можем хоть немного, но выиграть. Но сколько — принципиально неизвестно.

Нет ли здесь связи с квантовой механикой?

Научно-популярные каналы на Дзене: путеводитель
Новости популярной науки12 марта 2022