Найти тему

Моделирование уравнения регрессии в Excel.

При проведении исследований в эконометрике возникают ситуации, при которых определенному значению переменной x соответствует (условное) распределение вероятностей переменной y. Данная зависимость неоднозначна. По этой причине в эконометрике актуальной остается задача поиска закономерностей изменения параметров закона распределения y в зависимости от x. Зависимость между значениями одной из переменных и условным математическим ожиданием другой называется корреляционной зависимостью. В общем случае распределение y может зависеть от x1, x2,x3,x4…, xn.

Зависимую переменную y принимают выходной переменной, независимую называют — входной переменной или регрессором. Уравнения связи между ними есть уравнение регрессии. В случае единственной входной переменной регрессию называют парной, в общем случае — множественной.

При исследовании экономических закономерностей законы распределения значений выходной переменной неизвестны. Поэтому для приближенной оценки (аппроксимации) истинной функции регрессии используется выборочный метод.

На сегодняшний день вычислению коэффициентов корреляционной зависимости отлично помогает в MS Excel, располагая такими опциями,как «Регрессия» и «Корреляция», находящиеся в надстройке «Пакет анализа».

Рассмотрим моделирование уравнения регрессии в Excel.

Исходные данные для примера: a=1,b=6.

1. Ряд независимых случайных величин X из 50 значений (1а)

2. Смоделируем значения зависимой переменной Y* в соответствии с уравнением .Для данного случая возьмем уравнение Y=a+b*X. (1б,1в)

3.Выполняем генерацию ряда случайных чисел ei (величина разброса 20)

(Генерация случайных чисел в Excel: Графа «Данные-Анализ данных- Находим «Генерация случайных чисел»- ОК)

В том случае, если пакет анализа не подключен:

-2

В данном примере распределение чисел по нормальному закону распределения. Но его можно изменить в зависимости от решаемой задачи.

-3

4. Вычисляем набор значений: 𝑦𝑖=𝑎+𝑏𝑥𝑖+𝑒𝑖, 𝑖=1,…,50.

-4

Здесь столбец А2 – это значение X и C2 – это значение сгенерированной случайной величины е по нормальному закону распределения.

5.Скопируем любые 10 пар (𝑥𝑖,𝑦𝑖) – на отдельный лист.

-5

6. Построим поле корреляции – диаграмму зависимости показателя 𝑦𝑖 от фактора 𝑥𝑖. (Выделим эти 10 пар чисел® Вставка® Точечная диаграмма)

7. На диаграмму нанесем линию тренда.

На 10 пар:

Рисунок 5а− поле корреляции(на 10 пар)

-6
-7
-8
-9
-10

9. Восстановим коэффициенты a и b прямой: 𝑦 = 𝑎 + 𝑏𝑥 с

Запишем уравнение экспериментальной прямой:

y = aˆ + bˆx ,

где aˆ , bˆ – полученные в п. 8 оценки коэффициентов уравнения.

-11
-12
-13

Результат будет выглядеть следующим образом (рисунок 10а,10б)

-14

1. Построим набор значений yˆ i по уравнению: yˆ i = aˆ + bˆxi , i = 1, n .

2. Добавим график этой прямой на диаграмму.

3. Убедимся, что линия тренда и построенная прямая совпадают.(рисунок 11а,11б)

-15
-16

Выводы для данного примера: на основе сравнения полученных коэффициентов детерминации можно понять, что как при наличии 10 (R2=0,9628),так и при наличии 50 ( R2=0,9561) пар случайных переменных модель имеет высокую значимость, однако, в случае десяти пар случайных переменных результат немного точнее.