Видео:
Проводим анализ данных просмотров за месяц канала YouTube начиная с января 2018 года по ноябрь 2022 года. Данные я брал из аналитики своего канала.
Экспорт данных:
Импортируем данные в Gretl:
Выбираем нужный файл.
В моей версии программы экспортирует только формат xls., формат xlsx. Не поддерживает.
Далее выбираем начало экспорта с ячейки А1, на вопрос интерпретировать ряд как временной – выбираем да.
Выбираем временные ряды.
Выбираем ежемесячные данные.
Выбираем начальную дату: 2018:1
Получим:
Получим:
Видим для апреля и мая 2020 года характерен не типичный рост просмотров, по сравнению с другими периодами. Т. е. наблюдается существенный всплеск. Если вспомним, то на данный период приходился максимальный карантин, соответственно видим интерес к обучающим ресурсам со стороны студентов.
Введём переменные d1 и d2, компенсирующие это всплеск.
Выбираем:
Добавляем новую переменную d1:
Затем присвоим переменной d1 значения 0:
Потом редактируем значения:
На дату 2020:04 вводим значение 1 и нажимаем enter.
Выбираем применить, изменённые данные сохранены.
Аналогично задаём переменную d2 для мая 2020 года.
Построим коррелограмму временного ряда:
Выбираем количество лагов 6 (полугодовой интервал).
Получим:
По виду коррелограммы можем отнести ряд к рядам авторегрессии.
ACF (автокорреляционная функция имеет вид синусоиды или экспоненты) - это значит ряд авторегрессии - AR.
PACF (частная автокорреляционная функция) имеет два ярко выраженных лага, для остальных лагов значение близко к нулю. Следовательно, порядок авторегресии p=2.
Проверим ряд на стационарность с помощью расширенного теста Дики-Фуллера (ADF-тест).
Выбираем порядок лагов 2, так как предполагается p=2, спецификация с константой, так как не имеется трендовой составляющей. Выбираем уровень переменной.
Получим:
Вероятность принятия нулевой гипотезы р=0,000879, намного меньше 0,01. Следовательно с 1% уровнем значимости отвергаем нулевую гипотезу – ряд стационарен относительно своих уровней. Это значит при построении модели нам не надо брать разности уровней ряда.
Значит параметр разностей d=0. Рассматриваем уровни временного ряда.
В данной части мы произвели идентификацию временного ряда, как ряда авторегрессии с порядком p=2, параметр разности d=0, параметр скользящего среднего q=0.
Построение модели ARIMA рассмотрим в следующей статье: https://dzen.ru/a/Y6B_C5nR1gw86uFL?share_to=link
С нами учёба станет легче 🤓 Здесь консультируют, учат, проводят курсы и просто выручают студентов всех вузов! Работаю со студентами с 1999 года, имею большой опыт консультирования.
Онлайн-консультирование по экономическим и математическим предметам. Математика, математические методы и модели, статистика, эконометрика, макроэкономика, анализ хозяйственной деятельности, экономический анализ, финансовый менеджмент, финансовая математика, международные стандарты финансовой отчётности, и другие предметы.
Консультации в расчётах исследовательских и студенческих работ программах Excel, Eviews, Gretl, Statistica, SPSS, R-studio.Так же обучаем работе с данными программами. Помощь в сдаче экзаменов. По всем вопросам пишите в telegram (https://t.me/sm_smysl ) или в форму сбора заявок на сайте.
Онлайн помощь студентам: https://pro-smysl.ru/
Подписывайтесь на наши каналы:
https://www.youtube.com/@SMYS_L