Решил тряхнуть стариной и вспомнить статистику, которой последний раз занимался в вузе. Выяснилось, что забыл я её примерно полностью. Плюс два дня почти не спал, так что за точность расчёта не ручаюсь. Но вроде бы выходит примерно так.
Постулаты и выводы
При расчёте учтём несколько моментов:
1. На Олимпиадах, как известно, вручаются золотые, серебряные и бронзовые медали - за первые, вторые и третьи места соответственно. При этом участников любых соревнований много - гораздо больше, чем три. То есть основная часть выступающих остаётся без наград.
2. Число разыгрываемых комплектов медалей при этом в разы больше, чем число медалей у любой спортивной державы. То есть однозначно доминирующей силы на Олимпиадах нет.
3. Физиология представителей вида хомо сапиенс по всему миру примерно одинакова. В "большом спорте" мы приблизились уже к пределу её возможностей.
4. Вывод из пункта 3: раз так, то выигрывает та сторона, которая более эффективно просеивает своё население на выявление спортивных талантов и их обучение и подготовку. То есть это - индустриальный вид деятельности: основанный на сложной организации и мощных окологосударственных институтах.
5. Вывод из пунктов 3 и 4: то есть мощные спортивные державы "берут массой" - "Бог на стороне больших батальонов". Но тогда всё упирается, в конечном счёте, в случайность. В теорию вероятности: кому-то сегодня - в этот раз - повезло, кому-то нет. Завтра ситуация поменяется. Это касается не только и не столько отдельных спортсменов (в их личных успехах), сколько олимпийских сборных стран (в нахождении талантливых спортсменов).
6. Из всего этого следует важный вывод: число золотых, серебряных и бронзовых медалей, завоёванных отдельными странами, должно быть примерно равным. Именно потому, что это дело случая. Если какая-то мощная спортивная держава завоевала много золотых медалей, то серебряных и бронзовых у неё должно быть не меньше: получить "золото" можно, только загоняя в систему большого спорта как можно больше людей. Но тогда и вице-чемпионов станет пропорционально больше...
7. В случае мошенничества - применения допинга - правило из пункта 6 может нарушаться. Если кто-то даёт допинг наиболее перспективным своим спортсменам, то эти спортсмены выступят лучше, чем вышло бы без допинга. В результате у стороны, применяющей допинг, доля золотых медалей должна вырасти относительно серебряных и бронзовых.
8. Второй вариант использования допинга - "ковровый": давать его всем своим спортсменам вообще. Тогда статистически достоверной разницы между числом медалей разного достоинства не будет. Но это скрыть труднее.
Собственно, на этом можно было бы и закончить: желающие могут посчитать самостоятельно, а я что-то не совсем в форме. Но не могу удержаться от соблазна, чтобы тоже примерно прикинуть, что у нас должно выйти.
Средняя страна - Япония
Итак, посмотрим.
Берём отсюда данные по статистике Олимпийских игр. Для эксперимента возьмём нейтральный пример: Япония, спортивная держава "средней руки" (крупная, но далеко не лидирующая).
Летние Олимпиады: 142 - золото, 134 - серебро, 163 - бронза. Всего - 439.
Зимние Олимпиады: 10 - золото, 17 - серебро , 18 - бронза. Всего - 45.
Начнём с летних Олимпиад.
Доля медалей каждого достоинства должна составлять около 1/3. Выходит, округляя, по 146. Уже видно, что по золоту результат близок к достоверному.
Но посчитаем.
Математическое ожидание у нас - если я не путаюсь в терминах - 146.
Возможный разброс результатов - "дисперсия" - от 0 до 439 (теоретически же каких-то медалей могло вовсе не быть, а могли - опять же теоретически - выигрываться только такие и никакие другие), в среднем примерно 220.
Стандартное отклонение - "сигма" (лень выяснять, как тут греческие буквы вставляются) - рассчитывается, как квадратный корень из дисперсии, то есть, округляя, выйдет 220^0.5 ~ 15.
По теории вероятности, 2/3 всех шансов, что результат не будет отличаться от ожидаемого более чем на "сигму". Около 96% вероятности, что результат не будет отличаться от ожидаемого более чем на две "сигмы". Около 99,7% вероятности, что не более чем на три "сигмы".
Таким образом, наиболее вероятно, что число медалей каждого типа у Японии должно находиться в диапазоне от (146 - 15), то есть "ожидание минус сигма", до (146 +15), то есть "ожидание плюс сигма". Или - от 131 до 161.
Для золота и серебра всё правильно, по бронзе выходит чуть больше. Но вполне в пределах допустимого (вписывается в диапазон "две сигмы").
Если бы - к примеру - у Японии из 439 медалей 195 оказались бы золотыми, то вот тут мы были бы вынуждены сказать, что вероятность подобной статистической аномалии составляла бы менее 0.3%, так как
146 + 15*3 = 191, что меньше, чем 195.
Более того: 0.3% - это вероятность того, что результат не впишется в "три сигмы" как "сверху", так и "снизу", то есть что число золотых медалей будет "больше чем 191 или меньше чем 101". То есть, чтобы оценить вероятность того, что число медалей будет более чем на три стандартных отклонения превосходить ожидаемое (а не уступать ему), нужно 0.3% поделить ещё пополам...
Одним словом, в такой ситуации всё было бы понятно. Но к реальным результатам японской олимпийской сборной никаких вопросов нет: у неё всё соответствует наиболее вероятному варианту.
А как у Страны Восходящего Солнца дела на "Белых" Олимпиадах?
Ожидание - 15 медалей каждого типа. Дисперсия - 22.5. Отклонение, округляя, 5. По всем медалям - 10, 17 и 18 штук - результат вписывается в диапазон "сигма". Всё достоверно.
/////////////////////////////////////////////////////////////////
Мой второй канал - с научно-популярной тематикой:
////////////////////////////////////////////////////////////////
Честная Россия
Хорошо. Теперь возьмём Россию, обвинённую во всём, чём можно и нельзя.
Я не буду подробно расписывать вычисления: всё делается, как в случае с Японией выше, просто подставляются другие цифры.
Летние Олимпиады: 151 золото, 139 серебро, 161 бронза. Всего - 451.
Зимние Олимпиады: 49 золото, 40 серебро, 35 бронза. Всего - 124.
Лето:
Ожидание - 150. Дисперсия - 225. Отклонение - 15.
Фактически результаты по всем типам медалей вписываются в диапазон "сигма": 135 - 165.
Зима:
Ожидание - 41. Дисперсия - 62. Отклонение - 8.
Фактически результаты по всем типам медалей вписываются в диапазон "сигма": 33 - 49.
Сомнительный Китай
Берём более сложный случай - Китай.
Летние Олимпиады: 227 золото, 164 серебро, 152 бронза. Всего - 543.
Зимние Олимпиады: 12 золото, 22 серебро, 19 бронза. Всего - 53.
Лето:
Ожидание - 181. Дисперсия - 272. Отклонение - 16.
По золотым медалям в диапазон "сигма" результаты не вписываются никак: 181 + 16 = 197, что меньше, чем 227. В диапазон "две сигмы" также не вписываются: 181 + 16*2 = 213, что меньше, чем 227. В диапазон "три сигмы" результаты кое-как вписываются: 181 + 16*3 = 229, а это всё же больше, чем 227.
Это означает, что вероятность случайности такого серьёзного отклонения от ожидаемого результата составляет от 0.15% до 2%. Значительно ближе к 0.15. Ну да, в суде адвокаты, наверное, упирали бы на презумпцию невиновности - апеллируя к этим небольшим шансам...
Зима:
Ожидание - 18. Дисперсия - 27. Отклонение - 5.
По золоту результаты не вписываются в диапазон "сигма", они ниже:
18 - 5 = 13, а у нас 12 медалей. Но вполне вписываются в диапазон "две сигмы": то есть вероятность того, что так вышло случайно, составляет примерно от 2 до 15%. Скорее всего, так оно и есть.
Метки: #олимпийское движение , #спорт , #россия , #китай , #сша , #статистика , #политика , #история спорта , #хэ-теории , #спорт вне политики
"Исключительные" США
Проводим расчёт по той же схеме.
Летние Олимпиады: 1022 золото, 794 серебро, 704 бронза. Всего - 2520.
Зимние Олимпиады: 96 золото, 102 серебро, 84 бронза. Всего - 282.
Лето:
Ожидание - 840. Дисперсия - 1260. Отклонение - 35.
Даже в "три сигмы" по золотым медалям США не вписываются:
840 + 35*3 = 945, что значительно меньше, чем 1022. Да они не вписываются и в "пять сигм"! То есть вероятность "мухлежа" составляет намного более, чем 99.9%.
Какая неожиданность...
Зима:
Ожидание - 94. Дисперсия - 141. Отклонение - 12.
А вот тут результаты по всем типам медалей вписываются в диапазон "сигма". На "белых" Олимпиадах всё в порядке!
Какая забавная статистическая аномалия...
Интересно было бы посмотреть в историческом разрезе: когда именно самые сомнительные результаты достигались...
Зачем кавычки?
Действительно: если всё настолько ясно, если мошенничество в пользу США и отчасти Китая очевидно, зачем в заголовке статьи кавычки? Всё же понятно?
А затем, что это вовсе не камень в огород США и Китая. Это камень в огород Олимпийского движения как такового. Есть серьёзные подозрения, что оно всегда так было устроено. Были страны, "слишком значительные, чтобы проигрывать". Некоторым всегда было позволено больше.
Но для того, чтобы это понять, нужно посмотреть на ситуацию в историческом контексте. Это - в следующий раз.
PS: Но с надуванием США они, конечно, стыд совсем потеряли. Хоть бы серебра и бронзы им тоже подсыпали - для правдоподобия!
Вторая часть исследования олимпийской статистики >>>>>>>>>
См. также:
Навигатор по каналу "Ходячая Энциклопедия"