Найти в Дзене
Physics.Math.Code

Теория вероятностей: простая задача, которая поставит вас в тупик

За что мне нравится теория вероятностей? Одна из технических областей знаний, в которой задача может формулироваться одним предложением, но вызывать огромное количество интерпретаций и непонимания среди людей, изучающих математику. Еще интересен тот факт, что для большинства задача будет казаться очень простой. Но как мы уже знаем, это иллюзия...
Оглавление

За что мне нравится теория вероятностей? Одна из технических областей знаний, в которой задача может формулироваться одним предложением, но вызывать огромное количество интерпретаций и непонимания среди людей, изучающих математику. Еще интересен тот факт, что для большинства задача будет казаться очень простой. Но как мы уже знаем, это иллюзия. Еще теория вероятностей прекрасна тем, что является предметом для больших споров и обсуждений :) Итак, приступим...

Формулировка задачи

Вы подозреваете, что монетка неправильная (орлы выпадают чаще). При каком числе орлов на 200 бросков вы склонны признать этот факт?

-2

Как же нам рассуждать в этой задаче?.. Число испытаний довольно большое. Что же нам поможет: схема Бернулли, теорема Лапласа, уровень значимости или просто здравый смысл ?

Для человека, не связанного с математикой, может показаться, что при большом количестве испытаний количество "орлов" должно точно (или примерно?) равняться количество "решек". Так как все интуитивно понимают, что для правильной (симметричной и случайной) вероятность выпадения решки или орла равна 1/2 или 0.5. То есть если монетка неправильная, то мы должны получить больше орлов, чем решек. Поэтому первое ошибочное число, которое приходит в голову: 101 орел (и 99 решек). Но если подумать лучше, то эта вполне нормальная ситуация.

Более того, мы можем просчитать вероятность выпадения любого количества орлов в диапазоне от 0 до 200. Да, ближе к краям этого интервала вероятности будут стремиться к нулю, но всё же будут отличны от него. То есть всё может быть. Может даже 200 раз выпасть орел. Но вероятность этого оооочень мала. А именно p(200,200) = 6.22e-61 (то есть 6, умноженное на 10 в -61 степени ).

Тогда возникает вопрос. Всё таки, какое число выпадений орла должно нас насторожить на счет правильности (симметричности) монетки?

Кстати, вероятность конкретного выпадения k орлов из n бросков может посчитать по формуле Бернулли:

Вероятность выпадения k орлов из n бросков
Вероятность выпадения k орлов из n бросков

Чтобы не считать каждый раз на калькуляторе, можно набросать программный код для подсчета этой вероятности:

Код написан на Python 3
Код написан на Python 3

И похоже, что нет однозначного ответа на эту задачу. Всё зависит от ошибки и уровне надежности, который мы же сами и выбираем.

Данная задача вызвала бурное обсуждение в нашей группе в контакте. Почитать можно здесь: Обсуждение задачи про монетку

Ошибка игрока

В математической статистике есть такое понятие, как ошибка игрока или ложный вывод Монте-Карло. Этот термин отражает распространённое ошибочное понимание случайности событий. Связана с тем, что, как правило, человек не осознаёт на интуитивном уровне того факта, что вероятность каждого последующего исхода не зависит от предыдущих исходов случайного события. Теория вероятностей рассматривает каждое событие по отдельности как независимое от предыдущих. Несмотря на то, что в первую очередь такое ложное убеждение связывают со сферой азартных игр, оно распространено и в других областях человеческой деятельности и ему подвержены многие люди.

«Ошибка игрока» представляет собой ошибочное понимание случайности событий, что приводит к убеждению в том, что если в повторяющихся независимых исходах случайного процесса наблюдалось отклонение от ожидаемого поведения, тогда будущие отклонения в противоположном направлении становятся более вероятны. Однако такое умозаключение противоречит теории вероятности, изучающей случайные события, случайные величины. Согласно этой теории необходимо рассматривать каждое событие по отдельности, как статистически независимое от предыдущих, а не в цепи событий. Также в теории вероятности описывается закон больших чисел, формулирующий результат выполнения одного и того же эксперимента много раз. Согласно этому закону, среднее значение конечной выборки из фиксированного распределения близко к математическому ожиданию этого распределения.

Пример на практике

В случае с подбрасыванием монеты много раз вполне может произойти такая ситуация, когда выпадет 9 «решек» подряд. Если монета «нормальная» («правильная»), то для многих людей кажется очевидным, что при следующем броске вероятность выпадения «орла» будет больше: сложно поверить, что «решка» может выпасть десятый раз подряд. Тем не менее, такой вывод является ошибочным. Вероятность выпадения следующего орла или решки по-прежнему остаётся 1/2.

Нужно разграничивать понятия: вероятность выпадения «орла» или «решки» в каждом конкретном случае и вероятность выпадения «решки» n раз подряд (например, два раза подряд или десять раз подряд).

Еще более кратко и другими словами:

Бросаем монету 4 раза.
Вероятность того, что 4 раза выпадет орел равна 1/(2^4) = 1/16
Вероятность выпадения орла на 4-м подбрасывании, когда ранее на трех подбрасываниях выпал орел, равна 1/2.

Если теперь представить, что мы только что получили четыре последовательных «орла» подряд, так что если пятая монета выпадет «орлом» вверх, то мы закончили цикл из пяти «орлов». Игрок может надеяться, что скорее выпадет «решка» чем «орёл». Однако, это не так, вероятность такого цикла составляет 1/32 (один из тридцати двух). Ошибка заключается в том, что событие выпадения пяти «орлов» подряд равновероятны с событием выпадения четырёх «орлов» и одной «решки», каждое из которых имеет вероятность 1/32.

Хотя вероятность выпадения пяти «орлов» подряд составляет 1/32 = 0,03125, это вероятность по отношению к первому подбрасыванию. После первых четырёх подбрасываний их исходы уже известны, следовательно их вероятности равняются 1. Утверждение, что вероятность выпадения «решки» в следующем подбрасывании выше из-за предыдущих выпадений «орлов», то есть успехи в прошлом каким-либо образом влияют на шансы в будущем, и является заблуждением.

Из предыдущего видно, что, если мы подбросим монету 21 раз, тогда вероятность 21 «орла» составляет 1 из 2 097 152. Однако вероятность получения «орла» после 20 предыдущих «орлов» подряд является 1/2.

Такой вариант является применением теоремы Байеса, которая позволяет определить вероятность какого-либо события при условии, что произошло другое статистически взаимозависимое с ним событие.

Точного ответа в задаче нет. Но самое корректная оценка решения будет такой:
Математическое ожидание орлов для правильной монеты в серии из 200 бросков составит N*p=200*1/2=100. Дисперсия числа орлов D=N*p*q=200*1/2*1/2=50, а среднеквадратичный разброс δ=Корень(50)~7. В технике за критерий приемки принимают отклонение от ожидаемого среднего в две сигмы, т.е. орлов = 100+/-2*7, что соответствует диапазону [86; 114]. В диапазон 2δ попадают 95% случайных наблюдений. Числа за пределами этого диапазона должны отбраковывать монету как неправильную. В лабораторных измерениях принимают другие уровни достоверности 3δ (99,7%), а в некоторых областях науки 5δ.

Еще почитать по теме об ошибке игрока

Почитать о теореме Байеса

Наша библиотека в telegram (много книг для физиков, математиков и программистов) : https://t.me/physics_lib

Еще много полезного и интересного вы сможете найти на наших ресурсах:

Physics.Math.Code в контакте (VK)

Physics.Math.Code в telegram

Physics.Math.Code в YouTube

Репетитор IT mentor в VK

Репетитор IT mentor в Instagram

Репетитор IT mentor в Яндекс.Дзен