Найти в Дзене

ГОТОВЯТ ЛИ САНИ ЛЕТОМ?

Всем привет! Сегодня мы узнаем, следуют ли жители стран СНГ известной пословице. Для этого воспользуемся сервисом Google Trends. С его помощью можно отследить динамику поисковых запросов за произвольный промежуток времени. А значит - и интерес к заданной теме. Чтобы узнать, надо просто перейти на сайт https://trends.google.ru и вбить нужный запрос. По умолчанию он выдаст нам график, отражающий динамику поисковых запросов за год. Это интересно, но не показательно. Я рекомендую делать это за более широкий промежуток времени. Например, за последние 7 лет. Из рисунка видно, что интерес к саням ритмичен - каждый год наблюдается отчетливый пик. В принципе, можно навести на график мышкой и узнать на какой месяц он приходится. Но это не интересно. Поэтому скачаем данные, откроем их в Excel и начнем знакомство с анализом трендов. Данные и результаты анализа можно скачать здесь. Итак, чтобы проанализировать динамику поисковых запросов, надо выделить из них два компонента. Первый - это тр

Всем привет!

Сегодня мы узнаем, следуют ли жители стран СНГ известной пословице. Для этого воспользуемся сервисом Google Trends. С его помощью можно отследить динамику поисковых запросов за произвольный промежуток времени. А значит - и интерес к заданной теме.

Чтобы узнать, надо просто перейти на сайт https://trends.google.ru и вбить нужный запрос.

-2

По умолчанию он выдаст нам график, отражающий динамику поисковых запросов за год.

-3

Это интересно, но не показательно. Я рекомендую делать это за более широкий промежуток времени. Например, за последние 7 лет.

-4

Из рисунка видно, что интерес к саням ритмичен - каждый год наблюдается отчетливый пик. В принципе, можно навести на график мышкой и узнать на какой месяц он приходится. Но это не интересно. Поэтому скачаем данные, откроем их в Excel и начнем знакомство с анализом трендов.

Данные и результаты анализа можно скачать здесь.

Итак, чтобы проанализировать динамику поисковых запросов, надо выделить из них два компонента. Первый - это тренд, который задает общее направление. Тренд определяет, растет ли интерес к саням из года в год, падает ли или же не изменяется. Второй компонент - сезонность. Сезонность показывает в какие месяцы чаще запрашивают сани, а в какие - реже.

Я покажу два способа анализа трендов. Один - традиционный, второй - личный

Традиционный способ состоит из нескольких этапов. Первый - построить регрессионное уравнение тренда. Значения, полученные с помощью такого уравнения, показывают какой интерес был бы в определенный период времени в случае, если бы сезонности не было. Если мы говорим об Excel, то нагляднее всего сделать это через точечную диаграмму.

Для этого надо выделить весь столбик с показателями поисковых запросов, перейти во вкладку Вставка и нажать, "Вставить точечную диаграмму".

-5

Затем нажать правой кнопкой на точке и "Добавить линию тренда". Щелкаем на линию тренда и в появившемся справа блоке отмечаем "Показать уравнение на диаграмме"

-6

После этого надо вычислить значение уравнения по каждому периоду (месяцу). Для этого нам понадобится столбик с номером периода. Этот номер - x в уравнении. Пишем уравнение в ячейке, растягиваем вниз и получаем предсказанное значение.

-7

Ну а теперь, памятуя о том, что тренд - это то, что получилось бы, если бы сезонности не было, вычитаем из реальных значений интереса значения, предсказанные уравнением тренда. Эта разность предваряет вычисление коэффициентов сезонности. Их 12, по числу месяцев. Они вычисляются как среднее арифметическое от таких разностей за определенный месяц.

-8

Чем больше коэффициент сезонности, тем больше интерес в этом месяце. В принципе это не единственный способ проанализировать тренд в Excel. Но он - самый наглядный.

А теперь я расскажу о несколько ином методе. Предупреждаю! Чтобы разобраться в нем нужно иметь хотя бы базовые знания статистики, а чтобы реализовать - языка программирования R. Если вы готовы - прочитайте часть, выделенную курсивом

Итак, на практике я анализирую тренды с помощью Общих линейных моделей. Насколько это правильно не знаю, но для моих целей подходит. Общая линейная модель походит на линейную регрессию, с помощью которой мы делали уравнение тренда. Но в результате мы получим уравнение, которое включает не только тренд, но и сезонность.

Код на R выглядит так

library(readxl)
library(writexl)
setwd('~/R/ИССЛЕДОВАНИЯ/') #Переходим в папку с файлом
df = read_xlsx('ANEX Динамика поисковых запросов 20190129.xlsx') #Считываем файл
df$Месяц = as.factor(df$Месяц) #Указываем, что месяц является фактором, а не количественной переменной
fit = lm(Запросы~Период+Месяц,df) #Строим общую линейную модель
model = summary(fit) #Получаем основные коэффициенты модель
list_for_save=list('Модель'=data.frame(rownames(model$coefficients),model$coefficients), 'R-квадрат' = as.data.frame(model$adj.r.squared)) #Готовим модель к сохранению в Excel
write_xlsx(list_for_save;'Общая линейная модель.xlsx') #Сохраняем в Excel

В результате мы получаем такую табличку. Коэффициенты уравнения находятся в столбце Estimate.

-9

Разберем его компоненты:

  • Intercept или свободный член. Значение, которое примет количество поисковых запросов в нулевой период при условии, что он приходится на Январь
  • Период - собственно коэффициент при уравнении тренда. Он определяет, как изменяется интерес в зависимости от номера периода
  • Месяц2, Месяц3 и т.д. - сезонные коэффициенты, которые прибавляется в Феврале, Марте и т.д. В Январе не прибавляется ничего.

Качество модели определяется с помощью показателя R-squared. Он изменяется от 0 до 1. Чем он выше, тем лучше модель предсказывает сезонность.

Итак, подведем итоги. Для этого обратимся к графику сезонности.

-10

Как мы можем увидеть, наибольший интерес - в декабре. Так что гипотеза, о том, что люди готовят сани летом, в целом не подтверждается.

Ну, а если честно, то показанные мной методы можно применять и для решения более серьезных проблем. Вы можете пользоваться ими для анализа выручки, объема продаж, динамики рынка и т.д. Все зависит от тех задач, которые вам необходимо решить.

Желаю успехов!

Подписывайтесь на Яндекс.Дзен и вступайте в группу ВК.