Найти тему
Блокнот математика

Самые случайные распределения

Многие знают, или хотя бы слышали о свойстве экспоненциального распределения --- свойстве потери памяти. Это, в определенном смысле, самое случайное распределение: уже прошедшее не дает никакой информации о будущем. Но сюрпризом может оказаться, что такое распределение есть еще одно...

Пусть время жизни существа или объекта случайно и имеет некоторое абсолютно непрерывное распределение. Причем известно, что вероятность прожить всего X+Y лет тому, кто прожил уже X, равна вероятности прожить Y с самого начала. Тогда распределение может быть только экспоненциальным.

Добавить красок позволяет такая постановка: пусть вероятность прожить еще один год всегда одна и та же, независимо от того, сколько лет уже прожито. Это в чистом виде так для радиоактивных атомов --- вероятность распада за год не зависит от того, сколько лет атом уже просуществовал.

Для человека в том возрасте, когда риск умереть от детских болезней уже миновал, но старость еще далека, в общем-то это неплохое приближение.

Сюда же примыкает марковское свойство: характеристики системы зависят только от ее состояния, но не от предыстории.

Формально требуется равенство условной вероятности P(X+Y | X) обычной вероятности P(Y). Если применить формулу условной вероятности

P(A | B) = P(A и B) / P(B),

то получится уравнение P(X+Y) = P(X)P(Y).

Здесь P(X) --- вероятность прожить не меньше X, а P(A | B) --- вероятность события A при условии, что B уже произошло. Из непрерывных функций такому уравнению удовлетворяет только экспонента, поэтому

P(X) = exp(-aX).

Функция распределения F(x) --- это вероятность, то случайная величина меньше x, то есть F(X) = 1-P(X).

Параметр a имеет размерность, обратную размерности X (времени), а величина 1/a --- это математическое ожидание (и среднеквадратическое отклонение) распределения. Можно переписать формулу в виде 2^(-X/T), T --- период полураспада. За это время в среднем вымрет половина из большого количества особей. Параметр a --- любой положительный.

Если распределение дискретно, то есть время жизни исчисляется целыми сутками, например, получается геометрическое распределение: вероятность P(n) прожить n полных суток равна (1-p)p^n, где p --- параметр.

Параметр p имеет смысл вероятности --- вероятности прожить сутки, а P(n) --- вероятности прожить n полных суток.

В общем распределение определяют так: p --- вероятность неуспеха в одной попытке, а P(n) --- вероятность первого успеха после n неудачных попыток.

Это распределение тоже обладает свойством потери памяти и является дискретным аналогом экспоненциального.

Эти распределения --- самые случайные. Они же являются энтропийными, то есть доставляющими максимум энтропии при заданных ограничениях и потому тоже "самыми случайными" --- но о этом в другой раз!