Рассмотрим способ разложения временного ряда на трендовую, сезонную и остаточную составляющие. Под трендом понимаем общую закономерность ряда (изменение среднего значения со временем), под сезонностью — повторяющуюся закономерность в определенных периодах (чтобы говорить о сезонности, в датасете должно быть несколько периодов).
Для демонстрации загрузим набор данных о статистике пассажирских перелетов с 1949 по 1960 из библиотеки pmdarima: Разложение на перечисленные выше составляющие можно произвести с помощью функции seasonal_decompose из модуля statsmodels...
Нормализация справочников — это процесс приведения данных в справочнике к стандартному виду, чтобы устранить дубликаты, несоответствия и другие несовершенства. Этот процесс важен, когда у вас есть большие объемы данных, которые могут содержать ошибки или различные вариации одних и тех же данных. Процедура нормализации данных Процесс нормализации справочников включает следующие этапы: 1. Анализ данных. Определите, какие данные содержатся в справочнике и какие из них нуждаются в нормализации. 2. Определение стандартов...