Найти в Дзене

Машинное обучение 4. Плотность вероятности.

В прошлой статье мы вычисляли вероятность каких то событий, и этих событий было конкретное ограниченное количество: либо выпадает орел, либо решка. Но бывает и другая ситуация, например мы берем тысячу разных случайных людей и замеряем их рост. Рост может быть любым вещественным числом, например 156.0 см или 175.233453 см. Нарисуем такой график. Тут по оси x идет рост людей, а по оси y вероятность того что такой рост встретится у людей. При этом вместо слова "вероятность" тут используют выражение "плотность вероятности". Взяв какой то определенный рост, мы можем из графика узнать вероятность того что этот рост встретится, но так же мы можем узнать например вероятность того что рост будет встречаться в каком то диапазоне, например то что он будет больше 160 см, но меньше 170. Для этого надо воспользоваться определенным интегралом int1(f(x), 160, 170). Наш график всегда должен удовлетворять двум условиям: для любого x, y должен быть больше или равен нулю, ведь отрицательной вероятност
Оглавление

В прошлой статье мы вычисляли вероятность каких то событий, и этих событий было конкретное ограниченное количество: либо выпадает орел, либо решка. Но бывает и другая ситуация, например мы берем тысячу разных случайных людей и замеряем их рост. Рост может быть любым вещественным числом, например 156.0 см или 175.233453 см.

-2

Нарисуем такой график. Тут по оси x идет рост людей, а по оси y вероятность того что такой рост встретится у людей. При этом вместо слова "вероятность" тут используют выражение "плотность вероятности".

Измерение плотности вероятности.

Взяв какой то определенный рост, мы можем из графика узнать вероятность того что этот рост встретится, но так же мы можем узнать например вероятность того что рост будет встречаться в каком то диапазоне, например то что он будет больше 160 см, но меньше 170. Для этого надо воспользоваться определенным интегралом int1(f(x), 160, 170).

-3

Наш график всегда должен удовлетворять двум условиям: для любого x, y должен быть больше или равен нулю, ведь отрицательной вероятности быть не может, и еще плотность вероятности вообще по всему графику должна быть равна единице, ведь вероятность всегда изменяется от 0 до 1.

Замена переменной.

Пусть переменная r будет обозначать рост людей, а переменная v - их вес. Тогда наш график с ростом людей обозначим как a(r), и еще у нас будет такой же график но с весом разных людей - b(v). И еще у нас есть функция c(r) которая показывает как вес человека зависит от его роста.

Теперь мы можем составить формулу по которой, зная плотность вероятности роста людей, мы можем найти плотность вероятности веса.

b(v) = a( invfun(c(r)) ) * derivative(c(r))

где invfun(c(r)) это функция, обратная функции c(r), а derivative(c(r)) это производная функции c(r).

Кумулятивная функция распределения.

-4

Найдем плотность вероятности на графике, от какой то точки на оси x, и влево до бесконечности. Так мы найдем плотность вероятности того, что нам встретится какой то любой рост ниже этой точки на оси x.

Теперь мы можем для каждой точки на оси x указать плотность вероятности того, что рост будет ниже этой точки. Тогда мы получим новую функцию, которая называется "кумулятивная функция распределения". Эта функция всегда будет возрастать вверх, а еще ее производная от кумулятивной функции это и есть сама функция плотности вероятности.

Совместная плотность вероятности.

Вот есть у нас плотности вероятности по росту и по весу. Как найти вероятность того, что попадется человек с определенным ростом и весом?

-5

Нарисуем такой трехмерный график, где по оси x идет рост, по y - вес, а по z - плотность вероятности того, что встретится человек с определенным ростом и весом. И теперь с помощью двойного интеграла мы можем находить вероятность того что нам встретится человек у которого рост и вес будут в каком то диапазоне, например рост от 160 до 170, и при этом вес от 60 до 70.

Наука
7 млн интересуются