Одна из самых распространенных ошибок в анализе данных временных рядов, которую совершают новички – это предположение, что данные имеют регулярные точки и не содержат пропусков. На практике это обычно не подтверждается и приводит к неверным результатам. В реальных датасетах часто отсутствуют точки данных, а имеющиеся расположены неравномерно или непоследовательно. Поэтому перед анализом данных временных рядов следует провести этап предварительной подготовки: • Понять временной диапазон и детализацию временного ряда по точкам данных с помощью визуализации датасета; • Сравнить фактическое количество...
Рассмотрим способ разложения временного ряда на трендовую, сезонную и остаточную составляющие. Под трендом понимаем общую закономерность ряда (изменение среднего значения со временем), под сезонностью — повторяющуюся закономерность в определенных периодах (чтобы говорить о сезонности, в датасете должно быть несколько периодов).
Для демонстрации загрузим набор данных о статистике пассажирских перелетов с 1949 по 1960 из библиотеки pmdarima: Разложение на перечисленные выше составляющие можно произвести с помощью функции seasonal_decompose из модуля statsmodels...