Найти тему
СМЫСЛ. Помощь в учёбе.

Часть 1. Множественная регрессия в Excel.

Видео занятия

Строим корреляционную матрицу. Для этого используем надстройку «Анализ данных»

Выбираем в диалоговом окне «Анализа данных» - корреляция.

Надстройка "Анализ данных"
Надстройка "Анализ данных"

Далее заполняем диалоговое окно:

Диалоговое окно "Корреляция"
Диалоговое окно "Корреляция"

Получим корреляционную матрицу:

Корреляционная матрица
Корреляционная матрица

Наблюдается тесная связь между переменной Y и Х1, Y и X2, так как попарные коэффициенты корреляции составляют 0,8602 и 0,7479 соответственно. Это выше 0,7 – связь достаточно тесная.

Межу объясняющими переменными Х1 и Х2 коэффициент составляет 0,6311. Он ниже других, но имеет значение больше 0,6. Значит между объясняющими переменными, может быть корреляционная связь (явление мультиколлинеарности). Для обнаружения мультиколлинеарности есть ряд критериев, например VIF-критерий.

Парные коэффициенты корреляции можно ещё найти с помощью статистической функции КОРРЕЛ.

Заполняем диалоговое окно статистической функции КОРРЕЛ.

Диалоговое окно функции КОРРЕЛ
Диалоговое окно функции КОРРЕЛ

Получаем тоже значение, что и корреляционной матрице для Y и X1: 0,860227

Аналогично по отдельности можем найти и другие парные коэффициенты корреляции.

Строим множественную регрессию. Для этого в надстройке «Анализ данных» выбираем регрессия. Заполняем диалоговое окно.

Диалоговое окно "регрессия"
Диалоговое окно "регрессия"

Выбираем уровень надёжности 98%. Для коэффициентов регрессии будет найден доверительный интервал с уровнем с доверительной вероятностью 98%. Так же выбираем остатки, график остатков. Эти данные необходимы нам для дальнейшего анализа во второй части.

Получим.

Результат регрессии
Результат регрессии

Проведём анализ полученных данных.

Таблица R^2
Таблица R^2

Здесь выводятся: множественный коэффициент корреляции, коэффициент детерминации (R-квадрат), скорректированный коэффициент детерминации (нормированный R-квадрат), стандартная ошибка регрессии (S).

R-квадрат = RSS/TSS

Стандартная ошибка = (ESS/(n-m-1))^0.5

ESS (error sum of squares) – остаточная сумма квадратов.

Построенное уравнение регрессии объясняет изменение результативного показателя Y на 80,99%. Остальные 10,01% приходятся на случайные факторы и факторы не включённые в модель.

Таблица дисперсионного анализа
Таблица дисперсионного анализа

Здесь даны столбцы: со степенями свободы (df); суммой квадратов (SS), суммой квадратов, делённых на степень свободы (MS=SS/df). Так же дано значение F-критерия Фишера и вероятность принятия нулевой гипотезы о равенстве коэффициента детерминации нулю (Значимость F).

TSS (total sum of squares) – общая сумма квадратов отклонений зависимой переменной от средней или вся дисперсия зависимой переменной;

RSS (regression sum of squares) – сумма квадратов, обусловленная регрессией или объясненная часть всей дисперсии;

ESS (error sum of squares) – остаточная сумма квадратов, характеризующая влияние неучтенных факторов или необъясненная дисперсия.

F= (ESS/m)/(RSS/(n-m-1)), n=32 m=2

Значимость F= 3,51562998617576E-11 <<<<0.01. Не можем принять нулевую гипотезу, принимаем альтернативную. Коэффициент детерминации отличен от нуля. Уравнение значимо в целом.

Так же можно сравнить наблюдаемое значение F-критерия с критическим. Берём уровень значимости 0,01, число степеней свободы 2 и 29. И с помощью статистической функции F.ОБР.ПХ находим критическое значение распределения Фишера

Критическое значение распределения Фишера
Критическое значение распределения Фишера

F.ОБР.ПХ(0,01;2;29) = 5,420445

Наблюдаемое значение оказалось выше критического (61,766> 5,420445), отвергаем нулевую гипотезу – уравнение значимо в целом.

Таблица коэффициентов уравнения
Таблица коэффициентов уравнения

В данной таблице выводятся столбцы: коэффициентов регрессии; стандартных ошибок коэффициентов регрессии; t-статистик; вероятности принятия нулевой гипотезы для коэффициентов (Р-значение); доверительные интервалы для коэффициентов регрессии (95% интервал считается по умолчанию, 98% - мы задали сами в диалоговом окне регрессия).

Запишем полученное уравнение множественной регрессии.

Уравнение множественной регрессии
Уравнение множественной регрессии

Если P-значение < 0.05, то коэффициент регрессии можем принять значимым при 5% уровне.

Т. е. отвергаем нулевую гипотезу при 5% уровне значимости. Т. е. все коэффициенты полученного уравнения статистически значимы при 5% уровне, т. к. для них всех р-значение меньше 0,05.

Так же можем определить значимость коэффициентов, сравнивая наблюдаемые значения t-статистик с критическими. Находим критическое значения с помощью статистической функции СТЬЮДЕНТ.ОБР.2Х.

Критическое значение t-статистики Стьюдента
Критическое значение t-статистики Стьюдента

СТЬЮДЕНТ.ОБР.2Х(0,05;29)= 2,04523

Наблюдаемые значения t-статистик из таблицы, выше критического значения при 5% уровне значимости, отвергаем нулевую гипотезу. Коэффициенты регрессии являются статистически значимыми.

Так же можем получить расчёт для множественной регрессии, используя статистическую функцию Excel – ЛИНЕЙН.

Для неё берётся число столбцов, равное количеству объясняющих переменных плюс один (в нашем случае три), а количество строк всегда пять.

Выделяем диапазон: E37:G41. Ставим знак равно и находим функцию ЛИНЕЙН в статистических функциях.

Заполняем диалоговое окно:

Диалоговое окно функции ЛИНЕЙН
Диалоговое окно функции ЛИНЕЙН

Нажимаем клавиши

Ctrl + Shift + Enter
Ctrl + Shift + Enter

Получаем результат:

Результат ЛИНЕЙН
Результат ЛИНЕЙН

t-статистики определим делением коэффициента регрессии на стандартную ошибку.

Получим следующую таблицу.

Таблица с результатами расчётов
Таблица с результатами расчётов

Кроме t-статистики в этой таблице считает функция ЛИНЕЙН. t-статистики мы подсчитали сами дополнительно.

Принципиальное отличие функции ЛИНЕЙН от регрессии в пакете «Анализ данных» заключается в том, что при изменении самих данных, все значения в таблице ЛИНЕЙН пересчитываются автоматически сразу. А при работе с пакетом «анализа данных» надо запускать процесс ещё раз, т. е. вызывать диалоговое окно, заполнять его и нажимать «ок».

В следующей части мы рассмотрим тестирование полученной модели на наличие автокорреляции остатков и на наличие гетероскедастичности.

С нами учёба станет легче 🤓 Здесь консультируют, учат, проводят курсы и просто выручают студентов всех вузов! Работаю со студентами с 1999 года, имею большой опыт консультирования.

Онлайн-консультирование по экономическим и математическим предметам. Математика, математические методы и модели, статистика, эконометрика, макроэкономика, анализ хозяйственной деятельности, экономический анализ, финансовый менеджмент, финансовая математика, международные стандарты финансовой отчётности, и другие предметы.

Консультации в расчётах исследовательских и студенческих работ программах Excel, Eviews, Gretl, Statistica, SPSS, R-studio.Так же обучаем работе с данными программами. Помощь в сдаче экзаменов. По всем вопросам пишите в telegram (https://t.me/sm_smysl ) или в форму сбора заявок на сайте.

Онлайн помощь студентам: https://pro-smysl.ru/

Подписывайтесь на наши каналы:

https://vk.com/sm_smysl

https://www.youtube.com/@SMYS_L

Наука
7 млн интересуются