При проведении исследований в эконометрике возникают ситуации, при которых определенному значению переменной x соответствует (условное) распределение вероятностей переменной y. Данная зависимость неоднозначна. По этой причине в эконометрике актуальной остается задача поиска закономерностей изменения параметров закона распределения y в зависимости от x. Зависимость между значениями одной из переменных и условным математическим ожиданием другой называется корреляционной зависимостью. В общем случае распределение y может зависеть от x1, x2,x3,x4…, xn.
Зависимую переменную y принимают выходной переменной, независимую называют — входной переменной или регрессором. Уравнения связи между ними есть уравнение регрессии. В случае единственной входной переменной регрессию называют парной, в общем случае — множественной.
При исследовании экономических закономерностей законы распределения значений выходной переменной неизвестны. Поэтому для приближенной оценки (аппроксимации) истинной функции регрессии используется выборочный метод.
На сегодняшний день вычислению коэффициентов корреляционной зависимости отлично помогает в MS Excel, располагая такими опциями,как «Регрессия» и «Корреляция», находящиеся в надстройке «Пакет анализа».
Рассмотрим моделирование уравнения регрессии в Excel.
Исходные данные для примера: a=1,b=6.
1. Ряд независимых случайных величин X из 50 значений (1а)
2. Смоделируем значения зависимой переменной Y* в соответствии с уравнением .Для данного случая возьмем уравнение Y=a+b*X. (1б,1в)
3.Выполняем генерацию ряда случайных чисел ei (величина разброса 20)
(Генерация случайных чисел в Excel: Графа «Данные-Анализ данных- Находим «Генерация случайных чисел»- ОК)
В том случае, если пакет анализа не подключен:
В данном примере распределение чисел по нормальному закону распределения. Но его можно изменить в зависимости от решаемой задачи.
4. Вычисляем набор значений: 𝑦𝑖=𝑎+𝑏𝑥𝑖+𝑒𝑖, 𝑖=1,…,50.
Здесь столбец А2 – это значение X и C2 – это значение сгенерированной случайной величины е по нормальному закону распределения.
5.Скопируем любые 10 пар (𝑥𝑖,𝑦𝑖) – на отдельный лист.
6. Построим поле корреляции – диаграмму зависимости показателя 𝑦𝑖 от фактора 𝑥𝑖. (Выделим эти 10 пар чисел® Вставка® Точечная диаграмма)
7. На диаграмму нанесем линию тренда.
На 10 пар:
Рисунок 5а− поле корреляции(на 10 пар)
9. Восстановим коэффициенты a и b прямой: 𝑦 = 𝑎 + 𝑏𝑥 с
Запишем уравнение экспериментальной прямой:
y = aˆ + bˆx ,
где aˆ , bˆ – полученные в п. 8 оценки коэффициентов уравнения.
Результат будет выглядеть следующим образом (рисунок 10а,10б)
1. Построим набор значений yˆ i по уравнению: yˆ i = aˆ + bˆxi , i = 1, n .
2. Добавим график этой прямой на диаграмму.
3. Убедимся, что линия тренда и построенная прямая совпадают.(рисунок 11а,11б)
Выводы для данного примера: на основе сравнения полученных коэффициентов детерминации можно понять, что как при наличии 10 (R2=0,9628),так и при наличии 50 ( R2=0,9561) пар случайных переменных модель имеет высокую значимость, однако, в случае десяти пар случайных переменных результат немного точнее.