Найти в Дзене
Datanomics

Построение дашборда в Yandex DataLens на примере прогнозирования спроса в ритейле

Применение алгоритмов машинного обучения и технологий Data Science
позволяет бизнесу оптимизировать расходы и увеличить прибыль. Отправной
точкой принятия решений является анализ данных. Есть множество способов
представления данных, включая объемные отчёты и презентации, однако
самым наглядным и интерактивным инструментом является дашборд с
визуализацией данных, позволяющий следить за продуктом, вовремя
обнаруживать проблемы и проверять различные гипотезы. Расскажем об опыте построения дашбордов в сервисе Yandex DataLens на примере кейса прогнозирования спроса в ритейле. DataLens – это облачный BI сервис от компании Yandex. DataLens находится в экосистеме Яндекса и интегрирован с другими
сервисами: Яндекс.Погода, AppMetrica, Яндекс.Метрика, Яндекс.Карты,
Yandex Cloud Billing. Существует возможность подключения сторонних
источников данных: ClickHouse, MySQL, PostgreSQL, MS SQL Server, Oracle
Database, Greenplum, Google Sheets и других, которые есть в маркетплейсе. В сервисе ес
Оглавление

Применение алгоритмов машинного обучения и технологий Data Science
позволяет бизнесу оптимизировать расходы и увеличить прибыль. Отправной
точкой принятия решений является анализ данных. Есть множество способов
представления данных, включая объемные отчёты и презентации, однако
самым наглядным и интерактивным инструментом является дашборд с
визуализацией данных, позволяющий следить за продуктом, вовремя
обнаруживать проблемы и проверять различные гипотезы.

Расскажем об опыте построения дашбордов в сервисе Yandex DataLens на примере кейса прогнозирования спроса в ритейле.

О сервисе DataLens

DataLens – это облачный BI сервис от компании Yandex.

DataLens находится в экосистеме Яндекса и интегрирован с другими
сервисами: Яндекс.Погода, AppMetrica, Яндекс.Метрика, Яндекс.Карты,
Yandex Cloud Billing. Существует возможность подключения сторонних
источников данных: ClickHouse, MySQL, PostgreSQL, MS SQL Server, Oracle
Database, Greenplum, Google Sheets и других, которые есть в маркетплейсе.

В сервисе есть возможность настройки правил доступа, причем не только к отдельным объектам, но и к данным.

Рисунок 1. Доступ к дашборду в DataLens
Рисунок 1. Доступ к дашборду в DataLens

Этапы построения дашборда

1.   Постановка задачи

При построении дашборда необходимо понять, на какие вопросы он должен отвечать. Для нашего кейса интерес представляет:

  • мониторинг прогнозирования спроса (метрики качества, сводные таблицы);
  • мониторинг динамики продаж;
  • анализ продаж в различных магазинах.

Исходя из требований визуализацию можно разделить на две части: мониторинг прогнозов и анализ спроса. Это позволит отслеживать качество
работы алгоритма прогнозирования и проводить переобучение модели на
новых данных для поддержания точности, а также исследовать спрос в
различных точках, анализировать динамику продаж во время промоакций и
при их отсутствии.

Следующий шаг – это определение показателей, удовлетворяющих поставленным задачам. Для блока мониторинга прогнозирования спроса может
понадобиться график динамики фактических и прогнозируемых продаж, а
также информация о метриках качества прогнозной модели (в виде таблицы
или столбчатых графиков); для блока анализа продаж потребуются несколько
KPI с разными фильтрами, такие как средняя выручка, прибыль.

Далее стоит подумать о конфигурации этих показателей и графиков на
дашборде. Это сэкономит время на его создание и позволит получить
простое и понятное визуальное представление. Лучше ранжировать
информацию по высоте – уменьшать важность информации сверху вниз.

2.   Сбор данных

Если набор данных небольшой, можно загрузить в DataLens несколько файлов в формате .csv.

В нашем случае для визуализации нужны данные о реальных и прогнозируемых продажах, данные о промоакциях, остатках, спецификации товаров, информация о магазинах.

В DataLens реализованы коннекторы не только к локальным БД, но и к облачным, развернутым в YandexCloud. Мы для этих целей выделили кластер
ClickHouse в YandexCloud. (Рис.2).

Рисунок 2. Схема поставки данных для визуализации
Рисунок 2. Схема поставки данных для визуализации

3.   Построение визуализации

Процесс создания дашборда в DataLens состоит из нескольких этапов (Рис.3):

  1. Настройка соединения с источником данных, таких источников может быть несколько;
  2. Создание датасета: выбрав подключение, нужно создать модель данных и определить типы полей (показатели, измерители). Причем для БД, поддерживающих sql-синтаксис, существует возможность написания собственных сложных запросов;
  3. Создание графиков, показателей: выбрав датасет с нужными полями, можно создавать визуализации и варьировать настройки графиков (подписи, фильтры, цвета и др.)
  4. Создание дашборда: расположение созданных графиков и показателей на одной или нескольких страницах; добавление подписи, текста (есть поддержка markdown), слайдеров; настройка зависимостей, обновления виджетов.

Рисунок 3. Структура дашборда
Рисунок 3. Структура дашборда

В DataLens есть возможность создания геоаналитики. Располагая данными о
продажах, можно построить на карте торговые точки, а цвет и размер этих
точек будет соответствовать суммарной выручке в определенный период
времени (Рис.4).

Рисунок 4. Торговые точки на карте
Рисунок 4. Торговые точки на карте

4.   Публикация отчета

Прежде чем приступить к публикации отчета, необходимо продумать правила доступа пользователей. Это можно сделать на уровне облачных аккаунтов либо в настройках доступа внутри DataLens при публикации отчета. В рамках нашего кейса был сделан дашборд, состоящий из двух страниц (Рис.5-6). На страницах есть возможность выбора торговой точки, а также различных фильтров для создания нужного среза данных.

Рисунок 5. Страница мониторинга прогнозов
Рисунок 5. Страница мониторинга прогнозов

Линейный график позволяет визуально отслеживать корректность прогноза, а таблица с метриками – получить полную информацию о качестве работы модели. Цветовая гамма таблицы метрик настроена на возрастание ошибки, это помогает быстро найти и ликвидировать проблему в прогнозном сервисе.

Информация по определенному товару собрана в виде сводной таблицы,
которую при необходимости можно использовать в других отчетах.

Рисунок 6. Страница анализа продаж
Рисунок 6. Страница анализа продаж

Торговые точки на карте позволят следить за тем, как меняется динамика выручки или любой другой метрики от магазина к магазину. С помощью инструмента геоаналитики можно выявлять закономерности, связанные с различными геофакторами, например, открытия новых магазинов около торговой точки, за счет чего произошло снижение выручки.

Распределения суммарного объема продаж и выручки в группах товаров позволяют отслеживать успешность промоакций.

Заключение

Визуализация с помощью дашбордов облегчает работу с информацией,
ускоряет принятие решений, является удобным способом контроля и анализа.  Чтобы система BI приносила максимальную пользу, необходимо каждый отдельный дашборд рассматривать как продукт, который нужно улучшать и совершенствовать, добавлять новую информацию или исключать неактуальную, вовлекать пользователей в предоставление обратной связи.

Присоединяйтесь к нашему каналу в Telegram и следите за последними новостями в области Аналитики больших данных и Искусственного интеллекта.