Найти в Дзене
Квантовый скачок

Ключевое о теории вероятностей простым языком

Одним из ключевых направлений теории вероятностей является моделирование изменения различных величин, например, роста и веса человека. В терминах теории вероятностей это описывается как набор значений некой случайной величины, которая принимает их в соответствии с заданными вероятностями. При этом особую важность представляют среднее значение (математическое ожидание) и степень разброса значений

Одним из ключевых направлений теории вероятностей является моделирование изменения различных величин, например, роста и веса человека. В терминах теории вероятностей это описывается как набор значений некой случайной величины, которая принимает их в соответствии с заданными вероятностями. При этом особую важность представляют среднее значение (математическое ожидание) и степень разброса значений вокруг него (дисперсия, стандартное отклонение).

Например, смоделируем распределение роста мужчин со средним 175 см. и стандартным отклонением 10 см. Соответствующий график будет выглядеть следующим образом:

-2

Для нормального распределения характерно, что на расстоянии одного стандартного отклонения от среднего сосредоточены свыше 68% значений роста, а двух - 95%. То есть у подавляющего большинства мужчин рост будет находится в пределах 165-185 см.

Формально введенные понятия определяются как:

Случайная величина - некий объект, принимающий определенные значения с соответствующими им вероятностями. Например, в эксперименте по подбрасыванию монеты случайная величина принимает два значения (орел, решка) с заданными вероятностями (например, по 0.5).

Математическое ожидание - метрика среднего. Определяется как сумма произведений каждого значения случайной величины на вероятность его наступления:

-3

В случае, когда мы наблюдаем набор значений случайной величины длины n и не располагаем вероятностями их наступления, зачастую они полагаются равными 1/n и математическое ожидание подсчитывается как среднее всех значений:

-4

Дисперсия - метрика изменчивости значений случайной величины. Определяется как математическое ожидание следующей случайной величины:

-5

На практике при отсутствии данных о вероятностях значений дисперсии, по аналогии с математическим ожиданием полагают их равными 1/n и считают величину по формуле:

-6

Если математическое ожидание оценивается как среднее - x, то для получения оценки дисперсии применяют формулу:

-7

В этом случае дисперсию можно интерпретировать как усредненную сумму квадратов отклонений от среднего.

Стандартное отклонение - квадратный корень из дисперсии. Проще для интерпретации, чем дисперсия, так как по сравнению с ней исчисляется в тех же единицах, что и исходная случайная величина.