Провели множественный A/B-тест (три варианта: A, B, C), где каждое сравнение сделано с уровнем значимости (вероятностью ошибки I рода) α = 0.05 (5%). Какая результирующая ошибка всего теста? Для одного теста (A vs B) ошибка 5% означает, что если на самом деле различий нет, то мы всё равно с вероятностью 5% ошибочно решим, что они есть. В тесте 3 парных сравнений: A vs B, A vs C, B vs C. Если тесты независимы, то вероятность не совершить ошибку в одном сравнении: 1 − 0.05 = 0.95. Для трёх независимых тестов: 1 − (1 − α)ᵐ Для 3 тестов: 1 − (1 − α)³ P(нет ошибок) = 0.95 × 0.95 × 0.95 = 0.95³ ≈ 0.857 Значит: P(хотя бы одна ошибка) = 1 − 0.857 = 0.143 ≈ 14.3%. При множественным тестах вероятность ошибки растёт с количеством тестов быстро, для m = 5 вероятность ≈ 22.6% Для нивелирования ошибки можно использовать поправку Бонферрони. Для этого нужно разделить α на количество тестов: 0.05 / 3 ≈ 0.0167 — на каждое сравнение. Тогда ошибка для каждого теста 1.67%, а вероятность хотя бы одной ошиб