Найти в Дзене
StatSpace

Немного о сценарном прогнозировании

#лонгрид #статьи Выходим из праздников продуктивно: сразу с лонгридом по довольно интересной статье о сценарном прогнозировании! Статья фокусируется на изучении различий между прогнозами при разных сценариях (к примеру, разные прогнозы курса при разных сценарных ценах на нефть - будем дальше обсуждать результаты именно на этом примере). В целом, задача выглядит стандартной и довольно простой: оцениваем модель, описывающую связь зависимой переменной (курса) с какими-нибудь объясняющими (чем полнее набор, тем лучше - это нам завещали и теоретические основы эконометрики, и точность полученных прогнозов). Потом подставляем сценарные значения для объясняющих (используя несколько разных сценариев для цен на нефть и одни и те же сценарии для прочих объясняющих переменных - это важно) - и готово! Но, как выясняется, не всё так просто. Главная проблема такого подхода заключается в том, что меняя сценарий только для одной объясняющей переменной (цен на нефть), мы игнорируем её возможное влия

Немного о сценарном прогнозировании

#лонгрид

#статьи

Выходим из праздников продуктивно: сразу с лонгридом по довольно интересной статье о сценарном прогнозировании!

Статья фокусируется на изучении различий между прогнозами при разных сценариях (к примеру, разные прогнозы курса при разных сценарных ценах на нефть - будем дальше обсуждать результаты именно на этом примере). В целом, задача выглядит стандартной и довольно простой: оцениваем модель, описывающую связь зависимой переменной (курса) с какими-нибудь объясняющими (чем полнее набор, тем лучше - это нам завещали и теоретические основы эконометрики, и точность полученных прогнозов). Потом подставляем сценарные значения для объясняющих (используя несколько разных сценариев для цен на нефть и одни и те же сценарии для прочих объясняющих переменных - это важно) - и готово!

Но, как выясняется, не всё так просто.

Главная проблема такого подхода заключается в том, что меняя сценарий только для одной объясняющей переменной (цен на нефть), мы игнорируем её возможное влияние на остальные объясняющие переменные (скажем, темпы роста ВВП, инфляцию и всё вот это вот), из-за чего утверждения вида "при нефти в 100 долларов за баррель курс будет 70, а при нефти в 50 долларов за баррель курс будет на 15 рублей выше" неверны - потому что предполагают, что при нефти в 50 темпы роста ВВП, инфляция и прочие включённые в модель объясняющие переменные будут такими же, как при нефти в 100. А это, очевидно, не так.

Что делать? Ну, вариант "согласовывать в каждом сценарии траектории всех регрессоров" есть, но он достаточно сложен в реализации (потому что некорректное согласование, опять же, приведёт к некорректным оценкам). Авторы работы выделяют два простых случая, в которых понятно что делать (и случаи, в которых непонятно, что делать - тоже).

Первый случай совсем простой: если мы верим, что изменение одной объясняющей переменной никак не влияет на остальные, то мы можем делать всё то же самое, что обычно и делается, и всё будет правильно. Довольно очевидно.

Второй случай интереснее: если есть связи между объясняющими переменными, но они постоянные во времени (как минимум, они одинаковы на тестовой и обучающей выборке), то "стандартный подход" не будет работать корректно, НО если оценить модель только с одной объясняющей переменной (парную регрессию курса на цену на нефть, без остальных объясняющих переменных), то разница в прогнозных значениях курса при разных сценариях будет состоятельной (будет оценена корректно!).

Интуитивно это работает так: оценивая модель с пропущенными переменными, мы их влияние "запихиваем" в коэффициент при оставшейся (цене на нефть), и этот коэффициент теперь учитывает не только прямое влияние цены на нефть, но и косвенное, через пропущенные в модели переменные. Оценка коэффициента становится неправильной, но зато при изменении сценария мы видим общий эффект (не только прямой, но и косвенный)!

На самом деле, совершенно удивительный для эконометрики результат: чтобы получить состоятельную оценку, нам надо использовать неправильно специфицированную модель (с пропущенными переменными)!

Третий случай тоже существует - связи между объясняющими переменными есть, но они меняются. В этом случае, к сожалению, никакого простого решения не существует.