В научных исследованиях часто возникает необходимость поиска взаимосвязи между различными признаками исследуемых групп: ростом и весом человека, температурой тела и частотой пульса и многими другими. В приведенных примерах признаки связаны между собой - изменение одной переменной неизбежно приводит к изменению другой.
Предположим, необходимо выяснить, имеется ли связь между диаметром тела и диаметром ядра нервной клетки - нейрона. Для этого были выполнены соответствующие измерения у 10 клеток. Так выглядят полученные данные:
Далее всё очень просто. Запустим модуль Basic Statistics/Tables:
Выберем пункт Correlation matrices. Нажмём OK:
Мы видим диалоговое окно Correlation matrices. И, так как в этой статье мы рассматриваем базовый вариант расчёта корреляций, то нам потребуется только вкладка 1. Quick (Быстро). Она, в принципе, открывается по умолчанию.
Помимо Quick тут имеются ещё вкладки 2. Advanced (Расширенные настройки) и 3. Options (Устанавливает дополнительные опции для расчета корреляций). Как и в других модулях программы Statisticа, сверху и справа мы видим кнопки Summary, Cancel, Options.
Но сейчас нас интересуют кнопки с переменными, которые расположены сверху: One variable list (Один список переменных) или Two lists (rect. matrix) (Два списка (прямоугольная матрица)). В первом случае переменные выбираются из одного списка. Нажмём OK, и видим, что в поле First list отобразились номера наших переменных: 1 - 2, а поле Second list - пустое (none).
Кнопка Two lists (rect. matrix) предлагает два списка, из которых мы можем выбрать анализируемые переменные:
Нажмём OK, и видим, что в поле First list и Second list отобразились выбранные переменные - Диаметр нейрона и Диаметр ядра нейрона соответственно.
Остановимся на этом варианте выбора анализируемых переменных. Нажмём на кнопку Summary: Correlation matrix (Результат: Корреляционная матрица). Появится таблица, в которой содержатся рассчитанный коэффициент корреляции:
В нашем случае коэффициент корреляции является положительным и очень высоким (r = 0.92). Это указывает на прямую и очень высокую степень взаимосвязи между диаметром тела клетки и диаметром ее ядра. Помимо расчета коэффициента корреляции программа оценивает и его статистическую значимость. Статистически значимые коэффициенты корреляции выделяются красным цветом (p < 0.05), о чём нам говорит вторая строка (под первой, в которой указано название анализа (Correlations) - Marked correlations are significant at p < 0.05000. Третья строчка содержит объём выборки N = 10.
Под кнопкой Summary: Correlation matrix располагается кнопка Scatter plot matrix for selected variables. Нажав на неё, мы увидим корреляционные поля для выбранных переменных.
В нашем случае для переменных 1. Диаметр нейрона и 2. Диаметр ядра нейрона приведено корреляционное поле с линией регрессии, которая, как мы знаем, накладывается на точки, каждая из которых соответствует паре данных из таблицы. Для каждой переменной также приведены гистограммы частотных распределений.