Добавить в корзинуПозвонить
Найти в Дзене
Звездануло

29. Выпуск с отклонениями

Всем привет, народ! Это подкаст Звездануло, в котором я перевожу науку на человеческий язык. Сегодня мы будем говорить о том, как наука отсеивает зёрна от плевел, то есть, как понять, случилось-таки открытие, или еще рано открывать шампанское. Вот вам ютубчик: Вот вам ЯМ: А мы начинаем. Я думаю, что всей нашей звезданутой семейке уже оскомину набили всякие заголовки типа «Ученые открыли пятую силу во Вселенной», «В коллайдере нашли новую физику» и подобные истории. Сейчас научу, на что стоит обращать внимание, а что можно спустить в утиль. Итак, есть определенный параметр, который определяет степень доверия к каким-то новым открытиям. Представьте себе, что у физиков слова «Случайность», «Возможно», «Есть намек» и «Свершившийся факт» расписаны аж в цифрах. Вот ведь не живется людям без четкого разграничения. Итак, знакомьтесь. Сигма. Стандартное отклонение. Что это значит? Кирпич весит килограмм и еще полкирпича, помните такую загадку? Давайте не будем спорить с очевидным ответом, а во

Всем привет, народ! Это подкаст Звездануло, в котором я перевожу науку на человеческий язык.

Сегодня мы будем говорить о том, как наука отсеивает зёрна от плевел, то есть, как понять, случилось-таки открытие, или еще рано открывать шампанское.

Вот вам ютубчик:

Вот вам ЯМ:

А мы начинаем.

Я думаю, что всей нашей звезданутой семейке уже оскомину набили всякие заголовки типа «Ученые открыли пятую силу во Вселенной», «В коллайдере нашли новую физику» и подобные истории. Сейчас научу, на что стоит обращать внимание, а что можно спустить в утиль.

Итак, есть определенный параметр, который определяет степень доверия к каким-то новым открытиям. Представьте себе, что у физиков слова «Случайность», «Возможно», «Есть намек» и «Свершившийся факт» расписаны аж в цифрах. Вот ведь не живется людям без четкого разграничения.

Итак, знакомьтесь. Сигма. Стандартное отклонение. Что это значит?

Кирпич весит килограмм и еще полкирпича, помните такую загадку? Давайте не будем спорить с очевидным ответом, а возьмем обычный кирпич, который весит килограмм. Прям ровно. Прям ровно? Не знаю, как вы, но я когда слышу такой вопрос, сразу думаю «ну, плюс-минус». Вот этот плюс-минус нам и интересен. Давайте представим, что на заводе всё работает хорошо. Весы, конвейер, всё ровно. Но каковы шансы, что на конвейерную ленту не налипли крошки от предыдущих кирпичей? Когда поверяли весы на заводе? А когда поверяли весы, которыми поверяли весы?

В общем, мы никак не можем утверждать, что этот кирпич весит ровно килограмм тютелька в тютельку. Но давайте попробуем хотя бы понять, одинаковые ли они между собой? Ну, вы помните про налипшие крошки и проворовавшегося-таки сторожа. А, про сторожа я не говорил? Ну что вы, в самом деле, как маленькие?

-2

Ладно, мы берем тысячу кирпичей с одного конвейера и начинаем их перемерять. Давайте заново определим понятие килограмма. Вообще, сейчас его считают через постоянную Планка, а прежняя гиря стала, скажем так, музейным экспонатом. Но мы хотим вернуть что-то вещественное в палату мер и весов.

В общем, начинаем измерять наши кирпичи и складываем от самых легких к самым тяжелым. Мы можем даже пользоваться не весами, которые вычисляют прям массу, а просто сравнивать кирпичи между собой на весах с двумя чашками. Те, которые по результатам взвешивания весят одинаково – складываем в стопочку друг на друга. Получим прям наглядно график отношения количества кирпичей к их массе. Как думаете, как этот график будет выглядеть, если мы сгладим углы?

Как-то так будет выглядет гора кирпичей
Как-то так будет выглядет гора кирпичей

На самом деле, вы увидите вполне четкую волну. Или гору. Или коромысло. В общем, сами придумаете своё объяснение. Это называется кривая нормального распределения, гаусиана. Она используется много где, но нам нужна для кирпичей. Что нам расскажет наше наглядное пособие? Что есть очень мало кирпичей, которые весят меньше всего. Возможно, он будет один такой. Постепенно стопки растут и это говорит нам, что всё больше становится более тяжелых кирпичей. В какой-то момент все кирпичи становятся похожи друг на друга и лишь немного отличаются. Это будет самый пик нашей кривой. А дальше будет спад. Примерно такой же, как и в начале, только наоборот. Постепенно масса кирпичей будет увеличиваться, а их количество снижаться. В конце концов останется один-единственный кирпич, который весит тяжелее всех.

И вот теперь мы можем сказать, что на нашем заводе выпускаются кирпичи вот с таким вот весом, а идеал – это кирпич из самой высокой стопки посередине. Он и становится новой мерой килограмма и отправляется в палату мер и весов, как победитель.

Мы описали график, но давайте теперь его проанализируем и поймём, что же это такое?

Мы можем взять пик нашего графика за целевое значение и откладывать вправо положительные значения, а влево отрицательные. Какие именно значения? Отклонения от нормы. То самое плюс-минус. Смотрите, условно, те кирпичи, которые в самой высокой стопке весят 980 грамм. Помним про сторожа, ребят. Мы обзываем это килограммом и начинаем замерять кирпичи из двух соседних стопок. Выяснится, что они отличаются примерно на одинаковое значение, только одна стопка тяжелее, а другая – легче. Дяденьки ученые посчитали, что одно стандартное отклонение будет включать в себя результаты примерно 68 процентов измерений, то есть, 680 кирпичей из тысячи вправо и влево от центральной стопки. Разница между самым тяжелым кирпичом из этих 680 и нашим эталонным будет такая же, как между эталонным и самым легким из этой же выборки. Давайте представим себе, что разница будет плюс-минус 20 грамм. Это и есть сигма. Как дяденьки учёные посчитали это самое стандартное отклонение – расскажу чуточку позже, буквально через минутку.

-4

А дальше будет интересная штука. Кривая нормального распределения говорит, что в рамки двух стандартных отклонений, то есть, от 940 до 1020 граммов, поместятся уже около 950 кирпичей, то есть 95 процентов. Три сигмы – 998 кирпичей, то есть 99,8 процента результатов.

В общем, пока у нас есть тысяча кирпичей – мы можем говорить, что эталонные кирпичи нашего завода весят 980 грамм, плюс-минус двадцать. Выяснилось, что наш эталон килограмма не подходит для палаты мер и весов. А если налепить уже миллион кирпичей и пересчитать? Мы сможем уточнить наш эталон, скажем, уже до 997, плюс-минус 3 грамма. То ли первую тысячу мы мерили из отбраковки, то ли сторожа уволили, то ли камеры поставили… Не суть. Результат может меняться. Может и упасть, это просто нам так повезло.

Сигма тоже может скакать то вверх, то вниз. Давайте расскажу вам, как её считают.

Помните, что такое среднеарифметическое значение? Берем выборку из четырех кирпичей, измеряем их массу, делим на четыре и говорим – кирпич в среднем весит столько-то. Кстати, это опять же будет кирпич из самой высокой стопки – то есть, пик нормального распределения. А стандартное отклонение измеряется немного иначе. Формула сложная, так что сконцентрируйтесь.

Сначала мы вычисляем разницу между каждым измеренным реальным значением и среднеарифметическим. Эту разницу возводим в квадрат, то есть, умножаем саму на себя. Дальше мы находим среднеарифметическое значение вот таких вот квадратов, то есть складываем все эти квадраты и делим на их количество. А потом уже это значение ставим под корень. Давайте подведем итог. Квадратный корень из среднеарифметического значения квадратов разниц между измеренными значениями и среднеарифметическим. Получаем среднеквадратичное отклонение. Так оно тоже называется. Ещё называется среднеквадратическим отклонением, стандартным, квадратичным и так далее. В общем, теперь вы точно не заблудитесь.

Ещё разок повторю вам формулу
Ещё разок повторю вам формулу

Так. Мы разобрались с самим отклонением. Как этим пользоваться?

А для этого всегда нужно что-то, с чем вы сравниваете результат.

И здесь включается интересное. Разница в 1 сигму вообще практически не имеет значения для физики элементарных частиц. Результаты будут считаться примерно равными, в пределах погрешности. При этом, в интервал от минус сигмы до сигмы может попасть аж 68 процентов измерений, помните, да?

Разница до трёх сигм будет считаться статистически незначимой. Так, призрачный намёк. И это уже чуть больше 99 процентов всех измерений. Представьте, что новый измеренный результат выходит за рамки 99 процентов всех ваших результатов, а вы всё еще не можете сказать, что это точно другой результат.

От трёх до пяти – это уже повод для подозрений. Опять же – результаты еще официально не считаются прям разными.

И только начиная с пяти сигм разницу можно считать официальной. Факт налицо. Там уже не чаще, чем один результат из двух миллионов может отличаться на большую величину. А уж точность в шесть сигм говорит о том, что погрешность может быть обнаружена в одном случае из полумиллиарда.

Давайте на примере разберём эту историю.

Отойдём от кирпичей. Купим, условно, гречку. Если на пачке написано 800+-10 грамм, а на контрольных весах будет 850 граммов, то для физика это повод сказать, что у них информация на упаковке не соответствует действительности, а если в пачке будет 760 грамм – он, бедняга, сможет только неуверенно заявить о том, что возможно существует некоторое отклонение, но это не точно.

Почему так? Так исторически сложилось, что порой физики пытались говорить о свершившемся открытии при имеющейся точности в три сигмы и впоследствии пролетали с этим открытием. Поэтому учёные стали осторожнее.

В общем, теперь, когда увидите заголовки по типу «Физики на 99 процентов уверены в чём-то там» - учтите, что это даже не три сигмы и уверенности никакой нет.

На этом сегодняшний выпуск подходит к концу.

Напоминаю про всякие репосты, донаты, комменты, лайки, подписки, всю вот эту вот историю. Наследить можно на многих-многих платформах и я буду этому очень рад.

Задонатить можно в сборе на Тинькофф, на бусти и на ВК донат, я буду мегаблагодарен!

С вами был Роман Юдаев.

Услышимся в следующем выпуске.