Привет, друзья. В учебниках по теории вероятностей для самых маленьких рассматривают два вида случайных величин: дискретные и "непрерывные". Давайте посмотрим попристальнее, что бывает вообще, с точки зрения теории меры.
Итак, вероятностным пространством называют любое множество ("элементарных исходов"), в котором есть система ("сигма-алгебра") подмножеств-событий, и на них задана мера (вероятность). Случайной величиной называется любая измеримая функция на пространстве, то есть правило, сопоставляющее исходам числовые значения. Измеримая функция — значит вот что: прообраз отрезка измерим. То есть множество, на котором функция принимает значение А плюс-минус немного — должно быть измеримо для любого А и любого "немного". Либо оно пусто (пустое множество всегда входит в сигма-алгебру и всегда имеет меру нуль), либо измеримо: входит в сигма-алгебру и ему приписана мера. Мера, конечно, от нуля до единицы.
Но тогда отрезки на обычной числовой оси получают, помимо обычной длины, еще и вероятностную меру. Именно, меру их прообраза при данной случайной величине. Эта мера называется распределением случайной величины.
Например, игра в орлянку — это множество из двух исходов, О и Р, а сигма-алгебра состоит из О, Р, пустого множества и самого пространства {O,P}, а случайные величины — это любые таблички вида О:Х, Р:У. Например, пусть орлу сопутствует выигрыш 1 рубля, а решке — проигрыш, то есть число -1. Тогда распределением будет такая мера: у чисел 1 и -1 по 1/2, а остальное имеет меру нуль. Мера отрезка равна сумме мер тех точек (1 и -1), которые в него попали, и вариантов всего три: не попала ни одна, попала одна, попали обе.
Так что классификация распределений совпадает с классификацией мер.
Какие же бывают меры?
Ну, атомарные: это меры, сосредоточенные на отдельных точках (отдельных числах). Орлянка — хороший пример: вся мера "сидит" на двух числах, 1 и -1, а мера любого множества равна сумме мер тех (из этих двух) точек, которые в него попали.
Атомарные меры могут быть хитрыми, например можно задать меру на рациональных числах. Выстроить все дроби N/M в виде бесконечной таблицы и пересчитать обычной "змейкой", приписывая дроби меру "два в степени минус номер дроби" и считая мерой числа сумму мер всех дробей, ему равных.
Посчитайте-ка меру отрезка [0,1] при таком распределении.
Но атомарные меры не исчерпывают всех мер. Есть ещё, например, абсолютно непрерывные. Такая мера присуща отрезкам, но не точкам, из которых он состоит. У точек мера нуль. У отрезков — нет, а равна эта мера интегралу по отрезку от некоторой функции (плотности распределения). В итоге мера зависит от отрезка как абсолютно непрерывная функция, отсюда и название. Называть их "непрерывными" не совсем точно.
Примерами служат нормальное распределение, экспоненциальное, равномерное на отрезке с плотностью, равной константе на отрезке и нулю вне его.
Давайте разберём случай равномерного распределения. Вероятностным пространством может быть что угодно, но у нас пусть это будут точки, в которую воткнулся дротик при игре в дартс с той идеализацией, что мишень - математический единичный круг, а дротик имеет нулевую толщину. Сигма-алгеброй будут круги с центром в центре мишени (и всё, что они за собой "подтянут"). А вероятностная мера задана так, что вероятность попасть в круг радиуса R пропорциональна (равна) этому радиусу. (Это к реальному дартсу может не иметь никакого отношения!)
Случайной величиной будем считать расстояние до центра. Тогда она принимает значения от 0 до 1, и любой отрезок данной длины между 0 и 1 имеет одну и ту же вероятность, пропорциональную своей длине. Вот вам и равномерное распределение: это уже чисто числовая сущность, заданная на числовой прямой мера, которая похожа на обычную длину, но не совсем: отрезок внутри [0,1] имеет меру, равную длине; отрезок вне имеет меру нуль; а отрезок, который частично лежит в [0,1], имеет меру, равную мере своего пересечения с ним.
Могут быть смешанные меры, например, у точки "нуль" вероятность 1/2, а остальная мера абсолютно непрерывно распределена по нормальному закону. В итоге события "строго больше 0" и "строго меньше 0" имеют вероятность по 1/4, "0 или больше" и "0 или меньше" — 3/4. Вполне жизненная ситуация: если ставку не примут, то выигрыш нуль, а если примут, то как пойдет.
Но и это ещё не всё: есть меры сингулярные. Это мера, сосредоточенная на множестве с обычной мерой нуль. Такое себе трудно представить, конечно, но такое бывает. И даже иногда встречается на практике.
Классический пример — это канторово множество. Выкидываем из отрезка среднюю треть, с двумя оставшимися поступаем так же, и так далее. Получаем множество, которое можно описать так: это числа из отрезка [0,1], в троичном разложении которых нет единичек. На выкинутых отрезках зададим функцию равной середине отрезка, и достроим ее по непрерывности. Это лестница Кантора, функция непрерывная, но не абсолютно.
Она задает меру любого отрезка (в пределах [0,1]), так как мера отрезка — это разность Лестницы на его концах. Лестница монотонно не убывает, так что мера неотрицательна.
У лестницы есть производная, она равна нулю почти всюду, то есть всюду, кроме множества (обычной) меры нуль. У производной есть интеграл, равный тоже нулю, который с самой лестницей не совпадает. Так что мера не абсолютно непрерывна. Формула Ньютона-Лейбница неудоменно моргает в сторонке.
Мера не является и атомарной, так как мера отдельных точек равна нулю.
Это сингулярная мера.
Аналогия. Вот пусть у нас деньги, скажем, распределены по населению страны. Атомарная мера — это когда все деньги страны у конкретных людей, вот этого, этого и этого. А у остальных практически ничего нет. То есть деньги в городе — это деньги тех богатеев, которые в городе есть.
Абсолютно непрерывная — это когда у каждого, в масштабах бюджета страны, ничего нет, но в целом по городам и весям что-то и есть.
Сингулярная — это когда ни у кого ничего нет (в масштабах страны, конечно), но на территории, площадь которой с площадью страны практически совпадает, тоже ничего нет; а в целом по стране (и даже районам страны) всё есть. Такое трудновато себе представить: уж либо миллиарды распределены понемногу по сотням миллионов людей (не обязательно поровну), либо у кого-то реально заметные суммы. Можно провести такую аналогию: пусть есть города с очень высокой плотностью населения, и тогда получается, что в огромной области все деньги в одном маленьком городе, но при этом у каждого жителя города (и тем более загородного) денег мало: просто их самих очень много. В итоге и по жителям — ничего, и по площади — ничего, а в целом — очень даже чего.
Ну и любые сочетания возможны: атомарная плюс непрерывная плюс сингулярная - почему нет.
Может показаться, что мало ли что мы ещё можем обнаружить; но нет. Есть теорема, которая утверждает, что любая мера раскладывается в сумму трех: атомарной, абсолютно непрерывной и сингулярной.
Только надо договориться, что тривиальная мера — равная нулю на всех множествах — относится ко всем трем типам. Ну и каждое слагаемое, если оно не единственное нетривиальное, вероятностной мерой, конечно, может не быть: сумма всех трех должна быть ею.
Сила подхода Колмогорова в том, что он вообще не зависит от типа меры!
Продолжение следует.