Найти в Дзене
Генетика для всех

Разброс в биологических данных

Это ещё один из вопросов, который пробрался в новую федеральную рабочую программу по биологии для старшеклассников. Искушённый читатель скажет: «Это ж натуральная статистика! Зачем её в программу по биологии, да ещё и на канал про генетику?» А вы вспомните Менделя с его тысячами скрещиваемых горохов. Скрупулёзный подсчёт результатов, полученных от этих скрещиваний, сегодня бы назвали статистической обработкой. Естественная наука без математической проверки (без статистических методов) не обходится. Так что будем вникать. Без фанатизма, конечно, будем вникать. Всё-таки мы не статистики. Кстати, вникать, если вы заметили, мы начали ещё в предыдущей статье, где я рассказала про выборку и её достоверность: Итак, двигаемся дальше. Словосочетание «разброс в биологических данных» заменяем коротким словом «дисперсия». Дисперсия – в статистике это мера, которая как раз и показывает разброс между результатами Точка, от которой начинают отсчитывать этот самый разброс (дисперсию), – это среднее ар
Оглавление

Это ещё один из вопросов, который пробрался в новую федеральную рабочую программу по биологии для старшеклассников. Искушённый читатель скажет: «Это ж натуральная статистика! Зачем её в программу по биологии, да ещё и на канал про генетику?» А вы вспомните Менделя с его тысячами скрещиваемых горохов. Скрупулёзный подсчёт результатов, полученных от этих скрещиваний, сегодня бы назвали статистической обработкой. Естественная наука без математической проверки (без статистических методов) не обходится. Так что будем вникать. Без фанатизма, конечно, будем вникать. Всё-таки мы не статистики.

Кстати, вникать, если вы заметили, мы начали ещё в предыдущей статье, где я рассказала про выборку и её достоверность:

Итак, двигаемся дальше.

Словосочетание «разброс в биологических данных» заменяем коротким словом «дисперсия».

Дисперсия – в статистике это мера, которая как раз и показывает разброс между результатами

Точка, от которой начинают отсчитывать этот самый разброс (дисперсию), – это среднее арифметическое всех полученных показателей.

Рассмотрим простейший пример, в котором вычислим дисперсию

Медицинская комиссия в военкомате. Один из биологических параметров, фиксируемых в медицинских карточках призывников, - это их рост. Предположим, мы зафиксировали рост всех потенциальных призывников, которые сегодня побывали в военкомате, и у нас получилась следующая картина (надеюсь, понятно, что для упрощения задачи я на порядок уменьшила количество объектов):

-2

Как теперь вычислить дисперсию?

✅ 1. Найти среднее арифметическое. Для этого нужно сложить все элементы и разделить полученную сумму на их количество.

Суммируем рост всех призывников и делим на пять:

-3

✅ 2. Потом от каждого элемента по очереди нужно отнять среднее арифметическое, а получившееся число возвести в квадрат. Это называется квадратами отклонения от среднего:

-4

✅ 3. Найденные квадраты отклонения от среднего нужно сложить:

-5

✅ 4. Сумму разделить на количество элементов в выборке:

930 : 5 = 186

И что теперь нам делать с полученным показателем дисперсии? Как интерпретировать результат?

Дисперсия бывает:

маленькая (незначимая) – это когда у большинства элементов отклонение от среднего показателя незначительное;

большая (значимая) - это когда у большинства элементов отклонение от среднего показателя существенное.

Так ведь сразу и не скажешь, в каком случае дисперсия считается маленькой, а в каком большой. Это зависит от многих факторов, потому для каждого отдельного случая интерпретация полученной величины дисперсии будет своя. Однако существуют сферы, в которых даже вроде бы и небольшая величина дисперсии (разброса-отклонения) является значимой. Вот, к примеру, медицина. Представьте себе отклонение в содержании глюкозы в крови всего лишь на несколько миллимолей на литр. А ведь это уже существенно! В общем, для оценки значимости дисперсии в статистике есть специальные формулы, в которых учитывается и размер выборки, и величина среднего значения, и особенности той сферы человеческого познания, в которой проводится исследование.

Вот вам две выборки: одна уже знакомая нам по военкомату, другую сделали в президентском полку. Как думаете, в каком случае величина дисперсии по росту будет больше?

-6

Догадались? Конечно, у призывников в военкомате разброс-дисперсия будет больше. На комиссию пришли ребята самого разного роста, а в президентский полк отбирают только высоких.

А дисперсия по окраске волос, как думаете, где будет больше, в России или в Японии?

Кому это и зачем нужно определять дисперсию?

Ученый с помощью дисперсии поймет, насколько совпадают между собой результаты серии экспериментов. Низкая дисперсия покажет учёному, что данные более устойчивы, а высокая наоборот. Представьте себе, что он с помощью экспериментов оценивал влияние нового лекарства на подопытных кроликов. И вот у него в одной серии экспериментов все кролики выздоровели, в другой - только половина, а в третьей - почти никто. Очень высокая дисперсия! Можно ли такой препарат испытывать дальше уже на людях? То-то. Высокая дисперсия результатов экспериментов показала исследователю, что ему ещё пахать и пахать работать и работать над поставленной задачей.

И в обычной жизни понятие о дисперсии может пригодиться. Хотя бы для того, чтобы оценить потенциальные риски или понять, имеет ли смысл и дальше прилагать усилия, стоит ли овчинка выделки. Проверяете вы, к примеру, действие… да хоть недавно услышанной новой пикаперской фразочки, и результат всё время разный: одна улыбнулась, другая прошла мимо с кислой физиономией, третья посмотрела взглядом медузы Горгоны, четвёртая телефончик дала (потом оказалось, что фейковый), пятая согласилась встретиться в 19:00 в парке у фонтана. Ну, какова дисперсия? Высоковата? Да ну его это пикаперство.