Анализ и прогнозирование временных рядов

218 прочитали
 Статья подготовлена для студентов курса «Data Scientist» в образовательном проекте OTUS.    Анализ временных рядов — тема, достойная отдельного освещения в рамках изучения Data Science.
Статья подготовлена для студентов курса «Data Scientist» в образовательном проекте OTUS.

Анализ временных рядов — тема, достойная отдельного освещения в рамках изучения Data Science. К сожалению, ей уделено мало места в стандартных программах ВУЗов, зато она повсеместно встречается на практике. Именно поэтому на курсе «Data Scientist» в OTUS анализу временных рядов посвящена отдельная лекция, состоящая из двух академических часов.

Что такое временной ряд?

К временному ряду можно отнести любой процесс, который так или иначе выдаёт свои характеристики в развёртке времени, то есть речь идёт о данных, последовательно измеренных через некоторые промежутки.

Простой пример временного ряда — летательный объект, который посылает свои координаты на средства локации. К временным рядам относят и статистические данные о продажах, посещаемости и других процессах, рассматриваемых в определённом срезе дней/часов/минут.

Типовые задачи и способы их решения

Анализ и прогнозирование временных рядов позволяет решать задачи разной степени важности и в расширенном спектре областей. В частности, временные ряды анализируют в следующих целях:

— прогнозирование продаж на ближайший год и планирование логистики магазина на основании истории объёмов продаж за предыдущий год;

— прогнозирование нагрузки на серверы многопользовательской онлайн-игры на основании статистики увеличения количества посетителей;

— планирование производства каких-нибудь товаров на основании спроса за предыдущие периоды;

— составление годового прогноза землетрясений мощностью 7 баллов с учётом сейсмической активности за последние 50 лет и многое другое.

Основные подходы к решению задач

На текущий момент выделяют два глобальных подхода, позволяющих решать задачи, где данные представлены в виде временных рядов:

1. В классическом случае мы строим модель процесса и пытаемся математически аппроксимировать этот процесс.

2. Используя второй подход, мы не рассматриваем процесс во времени в чистом виде, а переходим к векторам признаков.

Кроме того, возможно комбинирование методов в виде ансамблей (блендинг, стекинг).

Подробнее ознакомиться с подходами к решению задач вы сможете в рамках курса «Data Scientist». Будем рады видеть вас в числе студентов!

Александр Сизов — опытный разработчик, учёный и эксперт по Machine/Deep learning.
Александр Сизов — опытный разработчик, учёный и эксперт по Machine/Deep learning.

Материал подготовлен для студентов курса «Data Scientist» в образовательном проекте OTUS. Чтобы присоединиться к ближайшей группе, обязательно пройдите вступительное тестирование:

ПРОЙТИ ТЕСТИРОВАНИЕ