Найти в Дзене
Art of Data&Statistics

Корреляционный анализ в программе Statisticа: базовый вариант (Quick, Быстро)

В научных исследованиях часто возникает необходимость поиска взаимосвязи между различными признаками исследуемых групп: ростом и весом человека, температурой тела и частотой пульса и многими другими. В приведенных примерах признаки связаны между собой - изменение одной переменной неизбежно приводит к изменению другой.

Предположим, необходимо выяснить, имеется ли связь между диаметром тела и диаметром ядра нервной клетки - нейрона. Для этого были выполнены соответствующие измерения у 10 клеток. Так выглядят полученные данные:

Две переменные - Диаметр нейрона и диаметр ядра нейрона, внесённые в таблицу:                     А) Exel, и Б) Statistica.
Две переменные - Диаметр нейрона и диаметр ядра нейрона, внесённые в таблицу: А) Exel, и Б) Statistica.

Далее всё очень просто. Запустим модуль Basic Statistics/Tables:

-3

Выберем пункт Correlation matrices. Нажмём OK:

-4

Мы видим диалоговое окно Correlation matrices. И, так как в этой статье мы рассматриваем базовый вариант расчёта корреляций, то нам потребуется только вкладка 1. Quick (Быстро). Она, в принципе, открывается по умолчанию.

-5

Помимо Quick тут имеются ещё вкладки 2. Advanced (Расширенные настройки) и 3. Options (Устанавливает дополнительные опции для расчета корреляций). Как и в других модулях программы Statisticа, сверху и справа мы видим кнопки Summary, Cancel, Options.

Но сейчас нас интересуют кнопки с переменными, которые расположены сверху: One variable list (Один список переменных) или Two lists (rect. matrix) (Два списка (прямоугольная матрица)). В первом случае переменные выбираются из одного списка. Нажмём OK, и видим, что в поле First list отобразились номера наших переменных: 1 - 2, а поле Second list - пустое (none).

-6

Кнопка Two lists (rect. matrix) предлагает два списка, из которых мы можем выбрать анализируемые переменные:

-7

Нажмём OK, и видим, что в поле First list и Second list отобразились выбранные переменные - Диаметр нейрона и Диаметр ядра нейрона соответственно.

Остановимся на этом варианте выбора анализируемых переменных. Нажмём на кнопку Summary: Correlation matrix (Результат: Корреляционная матрица). Появится таблица, в которой содержатся рассчитанный коэффициент корреляции:

-8

В нашем случае коэффициент корреляции является положительным и очень высоким (r = 0.92). Это указывает на прямую и очень высокую степень взаимосвязи между диаметром тела клетки и диаметром ее ядра. Помимо расчета коэффициента корреляции программа оценивает и его статистическую значимость. Статистически значимые коэффициенты корреляции выделяются красным цветом (p < 0.05), о чём нам говорит вторая строка (под первой, в которой указано название анализа (Correlations) - Marked correlations are significant at p < 0.05000. Третья строчка содержит объём выборки N = 10.

Под кнопкой Summary: Correlation matrix располагается кнопка Scatter plot matrix for selected variables. Нажав на неё, мы увидим корреляционные поля для выбранных переменных.

-9

В нашем случае для переменных 1. Диаметр нейрона и 2. Диаметр ядра нейрона приведено корреляционное поле с линией регрессии, которая, как мы знаем, накладывается на точки, каждая из которых соответствует паре данных из таблицы. Для каждой переменной также приведены гистограммы частотных распределений.

Наука
7 млн интересуются