Несколько философских рассуждений о понятии и природе вероятности. Прежде всего: что мы подразумеваем под случайными событиями?
Вроде как это события, которые мы не можем предсказать, но что значит "не можем"? Конечно, есть квантовый принцип неопределенности: вот там действительно "не можем" и это фундаментально. Но вероятностные методы возникли куда раньше, и прекрасно работали. В чем же дело?
Дело может быть в нехватке информации. Например, в силу правил игры: карты противника не видны, и всё на том. В итоге для тебя есть только вероятность, что дама справа, а для зрителя всё детерминированно.
А в шахматах или го вся информация на виду, и говорить о вероятности, что противник не заметит ловушки (в го это называется "хамете"), можно только с натяжкой.
Дело может быть в нехватке информации иного рода. Скажем, бросок монетки — это чистая механика, и в принципе там всё считается. Но чтобы посчитать, надо много чего знать. Форму монетки, начальную скорость (шестимерную, ведь там три компоненты вектора скорости центра масс и три компоненты вращения), начальное положение, характеристики поверхности стола, и даже состояние воздуха и его движения. Всю эту информацию ещё попробуй собери.
Но даже если информация есть, надо же ещё выполнить расчет, и сделать это быстро. Это ещё одна сложность. Аналогично в шифровании: всем понятно, как расшифровать текст с открытым ключом: вся информация открыта, секретов нет. Проблема только в том, что быстро восстановить ключ не получится.
Наконец, и это не последнее по важности — это неустойчивость процесса. Устойчивость в математическом смысле — это непрерывная зависимость от начальных данных (или ещё чего-то). Ну или, если проще, отсутствие накопления различий.
Устойчивый процесс не усиливает ошибки. Неустойчивый — усиливает. В итоге оба в принципе предсказуемы, только неустойчивый требует очень точного задания начальных условий и очень малых ошибок округления. В итоге на мало-мальски долгий срок прогноз невозможен или возможен, но принципиально случаен.
Вот простейший пример. Ваш выигрыш на шаге i получается умножением некоторого числа на 10 и отбрасыванием дробной части (она идёт на следующий шаг). Начинаем с числа 22/7. Что будет? На первом шаге будет много: 22/7≈3.142857, то есть вам дадут 31 рубль. Потом 4. Потом 2. Потом 8. Но с какого-то шага начнут сказываться очень малые погрешности. Например, на шаге 30 ваш выигрыш определяет погрешность порядка 10⁻³⁰.
Ровно то же самое в прогнозе погоды. Орбита Земли не идеальная окружность, но движение устойчиво, так что лето я предскажу уверенно, это вам не мир Игры Престолов. А вот погоду на 31 июля вам за полгода не предскажет никто. Да, будет тепло. Но не более.
Или рулетка: движение шарика устойчиво в смысле траектории, то есть то, что будет шарик где-то на колесе — это предсказать можно. А вот где именно — непредсказуемо. Ну или нужно адски тренироваться, чтобы уметь мгновенно рассчитать траекторию. Говорят, это возможно, рефлекс наподобие вратарского. Ну или собрать прибор, мгновенно и точно определяющий скорость шарика и проводящий расчет. Да и то это только в том случае работает, когда шарик уже катится, а ставки ещё делаются. Если бы это было не так, то мельчайшие вариации в силе броска приводят к 100% погрешности в результате.
Да и монетку полагается бросать как можно закрученнее, чтобы, с одной стороны, усложнить расчет, а с другой — сделать процесс неустойчивым, что тоже усложняет расчет. Если монету бросать строго горизонтально на матрац, то никто с вами играть не будет. А если монету бросает механизм, так что начальные условия практически постоянны, то одно из двух: либо результат будет немного предсказуем и по сути неслучаен, либо (если монетка летает долго и вращается быстро) неустойчивость процесса приведет к случайности исхода из-за накопления и усиления крохотных погрешностей в условиях старта и воздействии на монетку внешних факторов (от движения воздуха до гравитации Луны и других небесных тел).
Но на самом деле всё ещё тоньше. Вот, к примеру, есть некоторый прибор, который симулирует монетку, выдавая "орёл" и "решка". Попеременно. Ясно, что это неслучайный процесс, так как всё весьма предсказуемо. Но это если мы разгадаем правило. А если правило посложнее? А если в основном так, но иногда нет? Тогда — формально — предсказать ничего нельзя, и процесс случайный. Хотя 999 раз из тысячи всё ясно.
Это, кстати, нормально. Такой процесс будет случайным и для него есть своя теория. Например, его можно представить как сумму детерминированного и случайного с некоторым особенным распределением. Тут уместно вспомнить Талеба и его черных лебедей...
Но в целом, случайность предполагает отсутствие закономерности в смысле отсутствия предсказуемости. Но сами видите, что всё тонко. К счастью, это — в основном — работает.
Математически всё выглядит так, как это обычно и бывает. Есть отношения между математическими же объектами, а то, что это оказалось полезно — так и хорошо. Та же ситуация с геометрией, например: там точки, прямые и всякие круги, а что это пригодно для измерения участков — так и слава Урании.
Формально к случайности предъявляют такие требования: отсутствие предсказуемости (в любом смысле), это уже обсудили; и повторяемость сколь угодно много раз в тех же условиях (вот это и ставит под сомнение понятия "вероятность выйти замуж" или "вероятность выжить в авиакатастрофе").
Давайте обсудим понятие вероятности. Статистическое определение, как предел частоты появления события (повторять-то по предположению можно сколь угодно много раз), хорошо, но имеет два недостатка. Оно не годится для доказательств, ведь из того, что "это" сходится к одной второй, а вон то к одной третьей, ничего, в общем-то не следует. Кроме того, нет определения сходимости, нет оценки скорости, нет ничего. Я могу сказать, что частота выпадения решки стремится к 0.42, просто очень медленно. И что вы мне сделаете?
Можно выразить сходимость через вероятность уклонений, которая стремится к нулю — но это мы пытаемся определить вероятность через вероятность, а это заколдованный (порочный) круг.
Классическое определение опирается на понятие равновероятности. Мы берем конечное множество событий-"исходов", декларируем, что они равновероятны (пока это просто слово и не более) и определяем вероятность события как число исходов, при которых событие есть, деленное на общее число исходов.
Это идеально подходит к монетам, кубикам и картам. Исходами при вытаскивании карт будут сами карты. Событие "вытащили даму" наблюдается, если вытащили даму, а их в колоде четыре. Всего же карт, скажем, 52, то есть вероятность одна тринадцатая.
Если повозиться, то можно вывести из этого определения статистическое, увязав концы с концами, но остается мина: та самая задекларированная равновероятность.
Обычно ее обосновывают симметрией: все карты равнозначны, кубик симметричен, монета тоже, каждой траектории полета монеты, приводящей к выпадению решки соответствует такая же траектория, приводящая к выпадению орла.
Но если вы ошибетесь, то статистическое определение будет противоречить классическому. Равновероятные события должны иметь равную статистическую вероятность. А проверить это в точности — нельзя. Только приближенно можно, и надеяться, что этого хватит.
Например, пара кубиков. Сумма 9 вероятнее, чем сумма 10, потому что 9 получается в четырех случаях (3,6), (4,5), (5,4), (6,3), а 10 только в трех. Статистика это подтверждает. Но ведь кубики идентичны и исход (3,6) неотличим от (6,3). Если так, то и 9, и 10 получаются в двух случаях.
Но только упорядоченные пары равновероятны, а неупорядоченные нет. Исход (3,6) более вероятен, чем (5,5). Статистика это подтверждает.
Но симметрия благоволит обоим подходам. Если кубики разных цветов, то один первый, другой второй, ладно. А если оба черные, то как отличить первый от второго?
Получается, что классическая вероятность, чтобы быть полезной, опирается на статистическую и наследует ее пороки.
Дилемму решил Колмогоров, введя вероятностную меру. События стали подмножествами, точки множества стали исходами, вероятность — мерой, логические операции вроде И, ИЛИ, НЕ или "ИЛИ-ИЛИ" превратились в объединение, пересечение и т.п. операции над множествами, а случайные величины (что важно) стали измеримыми функциями на множестве — измеримыми в смысле данной меры.
Это позволяет строго доказывать теоремы. Включает в себя классику как частный случай (конечное множество, атомарная мера, равномерно распределенная). Обосновывает статистический подход как стремление меры к нулю. Может оценить и скорость сходимости.
Всё бы отлично, но ... почему это работает на практике? Ну вот почему-то работает. Так устроен мир, и это огромная удача, если позволите так выразиться.