В социальной гигиене и организации здравоохранения, в различных
разделах медицины и биологии часто приходится проводить статистический анализ связей всевозможных признаков в совокупности. Необходимо
уметь изучать особенности этих связей, определять их размеры и характер, а также оценивать их достоверность.
Врачу любой специальности в практической деятельности приходится наблюдать изменения в состоянии здоровья человека и отдельных групп населения, происходящие в результате воздействия определенных факторов, как в позитивном, так и в негативном направлении.
Для того, чтобы уметь отличить случайное от объективного надо знать и уметь это делать. Этому служит данная тема.
Необходимо знать:
- Коэффициент корреляции (оценка, методы расчета)
- Значение и практическое применение.
Контрольные вопросы:
1.Какие виды связи могут быть между явлениями в природе и обществе?
2. Определение функциональной связи. Примеры.
3. Понятие о корреляционной связи. Примеры.
4. Направление, сила, форма связи.
5. Методы определения коэффициентов корреляции.
Задачи для самостоятельного решения
ВОПРОСЫ ТЕСТОВОГО КОНТРОЛЯ
Информационный блок
Все явления в природе и обществе находятся во взаимной связи.
Различают две формы связи: функциональную и корреляционную.
Функциональная связь означает строгую зависимость явлений.
При функциональной связи изменение какого либо одного явления вызывает обязательно строго определенные по величине изменения другого явления.
Радиусу круга соответствует определенная площадь круга,
скорость свободно падающего тела определяется величиной ускорения
силы тяжести и времени падения, и т.д.
Такого рода связь чаще наблюдается в физико-химических явлениях.
В области биологических и общественных явлений чаще встречаются взаимосвязи иного характера.
Такого рода связи называют статистическими, или корреляционными.
Корреляция (лат.) – означает соотношение, взаимосвязь между признаками.
Корреляция – взаимосвязь между двумя или более переменными.
При корреляционной связи значению каждой средней величины одного признака соответствует несколько значений другого взаимосвязанного с ним признака.
Цель корреляционного анализа – установление наличия или отсутствия этой
взаимосвязи.
В случае, когда имеются две переменных, значения которых
измерены в шкале отношений, используется коэффициент линейной
корреляции Пирсона r, который принимает значения от -1 до +1.
Термин «линейный» свидетельствует о том, что исследуется наличие
линейной связи между переменными.
Для данных, измеренных в порядковой шкале, следует использовать
коэффициент ранговой корреляции Спирмена, так как он является
непараметрическим и улавливает тенденцию – изменения переменных в
одном направлении, который обозначается Rs и определяется сравнением
рангов – номеров значений сравниваемых переменных в их упорядочении.
Коэффициент корреляции Спирмена является менее чувствительным, чем
коэффициент корреляции Пирсона.
Важно отметить, что близкое к плюс единице или к минус единице
значение коэффициента корреляции говорит о силе взаимосвязи переменных прямой или обратной, но ничего не говорит о причинно-следственных отношениях между ними.
Например:
Всем известно, что рост и масса тела человека связаны между собой. У группы лиц с одинаковым ростом наблюдаются различные колебания массы тела. Однако эти колебания массы тела варьируют в определенных размерах – вокруг своей средней величины.
Между уровнем температуры тела человека и числом сердечных сокращений существует также зависимость. При одинаковой температуре тела у различных людей наблюдаются индивидуальные колебания частоты сердечных сокращений, варьирующие вокруг своей средней.
Уровень антитоксина в крови и заболеваемость дифтерией взаимосвязаны между собой. При одинаковом уровне антитоксина в разных группах детей встречается разное количество заболевших.
В качестве примеров корреляционной связи можно указать на связь между количеством проведенных профилактических прививок и размерами заболеваемости, между размерами заболеваемости и смертности, между сроками изоляции инфекционных больных и частотой вторичных заболеваний в очаге, между качеством питьевой воды и заболеваемостью острыми кишечными инфекциями и т.д.
Используя методы корреляции, важно помнить о возможности измерять связь между различными признаками только лишь в качественно однородной совокупности. Нельзя, например, сопоставлять рост и массу тела людей, состоящих из лиц разного пола и возраста.
Параллельное изменение признаков двух явлений само по себе еще не говорит (хотя и наводит на мысль) о наличии связи между ними, так как может быть обусловлено случайным совпадением многих обстоятельств, не связанных друг с другом.
Измерение связи методами статистики целесообразно только тогда, когда наличие и материальная природа связи хотя бы предположительно установлена специальными методами данной науки.
При наличии действительной связи, установленной на основе конкретного анализа материальной природы изучаемых явлений, статистика дает возможность измерить размер (тесноту, силу) этой связи и установить степень зависимости между изучаемыми явлениями.
Измерение связи заключается в определении ее размеров (тесноты, силы).
Под теснотой связи понимается степень сопряженности связанных признаков, широта варьирования каждого из них при изменении средней величины другого.
Помимо тесноты связи, статистические методы позволяют вскрыть форму этой связи.
По силе связи корреляция колеблется от 0 до 1:
от 0 до 0,3 – слабая,
от 0,3 до 0,69 – средняя,
от 0,7 до 1 – сильная.
При силе связи равной 1 выявлена полная связь (функциональная связь). Сила связи измеряется коэффициентами корреляции.
По характеру связь может быть прямой и обозначается (+) и обратной (-).
Прямая связь – это такая связь, когда изменение одного признака влечет за собой изменение другого в том же направлении. Обратная связь – один признак увеличивается, другой уменьшается.
По форме (или направленности) корреляционные связи подразделяются на прямолинейные, когда наблюдается пропорциональное изменение одного признака в зависимости от изменения другого (графически это выражается в виде прямой линии), и криволинейные, когда одна величина признака изменяется непропорционально изменению другой (на графике эти связи изображаются параболами или иной кривой линией).
Методы сравнения наблюдений, которые независимо от вида распределения называют ранговыми или непараметрическими, т.е. независящими от формы распределения признаков в генеральной совокупности.
Их применение в медико-биологических исследованиях более оправдано хотя бы потому, что они менее трудоемкие по сравнению с другими.
Наиболее часто в этом случае используется метод определения коэффициента корреляции рангов (Спирмена). Этот коэффициент целесообразно использовать, при наличии небольшого числа наблюдений в случаях, когда сопоставляемые данные носят приближенный характер, а форма связи – криволинейна.
При наличии прямолинейной связи между взаимосвязанными компонентными признаками, особенно при большом числе наблюдений, рациональнее прибегать к параметрическим методам оценки, которые требуют вычисления определенных параметров средней величины, среднеквадратического отклонения, средней ошибки. При этом вычисление связи проводится при числе наблюдений 30 и менее сравниваемых пар по методу квадратов (К. Пирсона).
Метод определения коэффициента ранговой корреляции или метод рангов, или метод Спирмена (по автору)
Последовательность расчета:
Задача:
Влияние удельного веса нестандартной воды по бак. показателям в Свердловском районе г. Перми на заболеваемость ОКИ.
Эталон решения
Вывод: Между уровнем заболеваемости ОКИ и качеством воды существует сильная прямая связь.
Метод квадратов (Пирсона) вычисления коэффициента корреляции.
Этот метод более точен.
Недостаток: может быть использован только для количественных признаков.
Метод корреляции Пирсона - наиболее часто применяемый метод корреляции, способ квадратов. Предложен английским статистиком К. Пирсоном
Можно использовать:
- Если связь между переменными линейная
- При числе наблюдений не больше 30
- Можно использовать только для количественных значений
- Числовые значения невелики
Формула расчета коэффициента корреляции Пирсона
Порядок расчета коэффициента корреляции Пирсона
ПРИМЕР. Влияние введения раннего прикорма
ПРИЛОЖЕНИЕ
Критические значения коэффициента корреляции
Полезный ресурс:
САЙТ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОГО МЕДИЦИНСКОГО ЦЕНТРА ИНФАМЕД.
На сайте представлен набор скриптов, иллюстрирующих некоторые методы статистической обработки результатов медицинских исследований. Также здесь можно найти ссылки на медицинские журналы, статьи и научные работы по мед. статистике.