Найти в Дзене
Александр Шуравин.

Математика для чайников. Урок 23. Теория вероятностей: Играем в угадайку с числами (и не только!)

Оглавление
Изображенеи взято из открытых источников
Изображенеи взято из открытых источников

Предыдущая статья:

Начало:

Для начала определимся, а что вообще такое, теория вероятностей.

Теория вероятностей – это научная дисциплина, которая анализирует явления, которые мы называем случайными событиями. Случайными событиями считаются те, чей результат невозможно предсказать заранее. Эта область знаний служит фундаментом для математической статистики, которая разрабатывает математические подходы к систематизации и применению статистической информации для получения выводов, полезных в научных исследованиях и практической деятельности.

Стоит подчеркнуть, что теория вероятностей не занимается попытками предсказать исход случайных событий. Её фокус – это анализ самих случайных событий как таковых. Может показаться, что кроме как пытаться предсказать, в таких событиях нечего исследовать. Однако, в окружающем нас мире существуют события, которые принципиально не поддаются прогнозированию. Например, подбрасывание монеты. Результатом может быть либо «орел», либо «решка». Для точного прогноза потребовалось бы измерить силу броска, определить точку приложения силы и вычислить траекторию полета. Вероятнее всего, выполнить такие измерения и расчеты невозможно, поэтому данное событие и классифицируется как случайное. Но представим ситуацию: вам предлагают сыграть в игру, где выпадение «решки» приносит вам два доллара, а при выпадении «орла» – вы теряете один доллар. Согласитесь ли вы на такую игру? Ответ на этот вопрос как раз и входит в сферу компетенции теории вероятностей.

Представьте, что вы кидаете монетку. Какова вероятность, что выпадет «орел»? Интуитивно понятно – 50 на 50. И это правильно, если, конечно, монета ровная, без всяких сточек и прочих мошеннических обработок.

Но вернемся к нашей задаче. Вероятность 50 на 50 буквально означает, что в половине случаев монета выпадет «орлом» вверх, а в половине «решкой». Но это в теории. На практике будут отклонения. Предположим, вы подбросили монету 10 раз, и «орел» выпал 6 раз, а «решка» – 4. Увеличив количество бросков до 100, отклонения от идеального соотношения уменьшатся, скажем, результат будет 52/48. Однако, в среднем, частота выпадения «орла» и «решки» стремится к 50 на 50. Если же подбросить монету миллион раз, то примерно в половине случаев выпадет «решка» (500 000 раз), а в другой половине – «орел». Учитывая предложенные условия игры, при миллионе бросков вы получите 500 000 × 2 = 1 000 000 долларов, а отдадите 500 000 × 1 = 500 000 долларов. Таким образом, полученная сумма превысит отданную, что делает игру выгодной, и, следовательно, стоит согласиться. Тем не менее, при решении подобных задач обычно не оценивают итоговую прибыль или убыток, полученный после огромного количества испытаний. Вместо этого вычисляют среднее значение, на основе которого и принимают решение. Но давайте разберемся во всем по порядку.

В общем, это и есть основа теории вероятностей: оценка шансов наступления какого-либо события.

Теперь определения.

Итак, вероятность – это число, показывающее, насколько вероятно, что что-то произойдет. Оно лежит в диапазоне от 0 до 1:

• 0 (или 0%) – событие точно не произойдет. Например, вероятность того, что свинья научится летать (без реактивного ранца, конечно).

• 1 (или 100%) – событие точно произойдет. Например, вероятность того, что солнце завтра взойдет (надеемся, что так и будет!).

• 0.5 (или 50%) – равные шансы, что событие произойдет или не произойдет. Как с монеткой.

Как считается вероятность?

В простых случаях, когда все исходы равновероятны, вероятность можно посчитать по формуле:

-2

где P(A) – вероятность наступления события A, n – количество благоприятных исходов, N – общее количество возможных исходов)

Примеры из жизни (и не только):

• Бросаем кубик: Какова вероятность выбросить 6?

• Благоприятный исход: 1 (только одна грань с 6).

• Общее количество исходов: 6 (все грани кубика).

• Вероятность: 1/6 (примерно 0.167 или 16.7%).

• Тянем шарик из мешка: В мешке 3 красных и 7 синих шариков. Какова вероятность вытащить красный шарик?

• Благоприятный исход: 3 (количество красных шариков).

• Общее количество исходов: 10 (общее количество шариков).

• Вероятность: 3/10 (0.3 или 30%).

• Выбор случайного человека: В классе 15 мальчиков и 10 девочек. Какова вероятность, что случайно выбранный ученик окажется девочкой?

• Благоприятный исход: 10 (количество девочек).

• Общее количество исходов: 25 (общее количество учеников).

• Вероятность: 10/25 = 2/5 (0.4 или 40%).

Но бывают и более сложные случаи: когда не все так просто. Иногда исходы не равновероятны. Например, если кубик «кривой» и шестерка выпадает чаще, чем другие числа. Или монета подпилена, как в первом примере. В этом случае нужно использовать более продвинутые методы, такие как:

Статистика: Собираем данные (например, бросаем кубик много раз) и оцениваем вероятности на основе этих данных.

Условная вероятность: Оцениваем вероятность события, зная, что другое событие уже произошло. Например, какова вероятность, что пойдет дождь, если небо затянуто тучами?

Теорема Байеса: Позволяет обновлять нашу оценку вероятности, когда получаем новую информацию.

О теореме Байеса следует сказать более подробно. Математически, эта теорема формулируется при помощи вот такой вот формулы:

-3

где P(A) так называемая априорная вероятность гипотезы A (вероятность того, что событие Aвообще случится, P(A|B) – вероятность гипотезы A при наступлении события B(так называемая апостериорная вероятность), P(B|A) – вероятность наступления события B при истинности гипотезы A, P(B) – полная вероятность наступления события B.

Чтобы лучше понять эту формулу, рассмотрим несколько примеров.

Пример 1. Какова вероятность того, что если машина не заводиться, то пуст бензобак, если вероятность того, что машина не заведется при пустом бензобаке равна 1 (100%), вероятность того, что случайно взятая машина не заведется, равна 0.01 (1%), а вероятность того, что в случайно взятой машине нет топлива равна 0.005 (0.2%). В этом случае событие A– это то, что в баке нет топлива (наша гипотеза). Вероятность того, что машина не заводиться, если в баке нет топлива, это P(B|A), соответственно, вероятность того, что в баке случайно взятой машины нет бензина – это P(B). Подставляем:

-4

Почему в результате у нас получилось 20%? Потому, что если машина не заводится, этот еще не значит, что бак пуст. Есть и другие причины, например, сел аккумулятор, неисправны свечи зажигания или двигатель.

Пример 2.Эта задача про хитрый парадокс. Пусть вероятность того, что случайно взятый человек болеет смертельно опасным видом рака 0.0001 (0.01%). Существует некий метод диагностики, который выявит у больного рак с вероятностью 0.95 (95%), но бывают случаи, когда данный метод показывает наличие болезни у здорового человека (ложноположительный результат). Вероятность такого события 0.02 (2%). Какова вероятность, что человек действительно болеет раком, если диагностика показала положительный результат.

Событие «диагностика показывает, что человек болен» обозначим буквой «б», а то, что здоров, буквой «з». Событие, что человек действительно болен, обозначим буквой «Б», а то, что здоров, буквой «З». Тогда:

-5

Вероятность того, что человек здоров при результате «болен» равна:

-6

В этой формуле неизвестны P(б)и P(З). Найдем их.

Вероятность того, что пациент здоров:

-7

Вероятность того, что тест покажет, что человек болен является суммой вероятности признания его больным когда он на самом деле болен и когда здоров:

-8

Подставляем найденные значения в формулу:

-9

Внезапно, да? А все дело в том, что вероятность обнаружить больного крайне мала, так как болеют всего один из десяти тысяч. Чтобы исключить такую ошибку, в случае положительного результата надо сделать повторный тест.

Тогда:

-10

Считаем:

-11

Вероятность ложного сигнала все равно высокая, но уже значительно ниже. К слову, если провести третий тест, то тогда вероятность ложного срабатывания будет уже 8.5%.

Если у вас все еще вертится на языке вопрос: «Зачем нужна теория вероятностей?», то отвечу: Теория вероятностей – это не просто математическая забава. Она используется повсюду:

Страхование: Страховые компании оценивают риски (вероятность аварий, болезней и т.д.) чтобы устанавливать тарифы.

Финансы: Инвесторы используют теорию вероятностей для оценки рисков и доходности инвестиций.

Медицина: Врачи используют ее для оценки эффективности лекарств и диагностических тестов.

Наука: В физике, биологии, социологии и других науках теорию вероятностей используют для анализа данных и построения моделей.

Программирование: В машинном обучении теория вероятностей – основа для создания алгоритмов, которые могут предсказывать, классифицировать и принимать решения.

Прогнозирование погоды: Синоптики используют вероятности, чтобы оценить, насколько вероятно, что пойдет дождь или будет солнечно.

Теория вероятностей – это мощный инструмент для понимания и управления неопределенностью. Она помогает нам принимать более обоснованные решения в мире, где мало что известно наверняка. Хотя иногда она кажется сложной, основная идея проста: оценить шансы, чтобы лучше понимать, что может произойти. Так что, в следующий раз, когда будете кидать монетку, помните – это не просто игра, это теория вероятностей в действии!

Следующая статья: