Продолжение. Начало здесь.
Business Intelligence — это набор методологий, процессов, архитектур и технологий, которые преобразуют необработанные данные в значимую и полезную информацию, используемую для обеспечения более эффективного стратегического, тактического и оперативного анализа и принятия решений.
BI состоит из четырех ключевых функций:
- Сбор данных
- Анализ
- Мониторинг
- Прогноз
Когда мы обращаемся к каким-нибудь источникам, мы делаем запрос.
У нас есть база, откуда поступают данные какой-то системы, например, CRM-системы, или какого-то внешнего источника. Мы пишем SQL-запрос, в котором сразу можем определить требуемые нам поля, сразу агрегировать, посчитать какие-то суммы, средние значения, вывести в в таблицу в наш отчёт.
Это идеальная картина мира. Она работает далеко не всегда, потому что не все компании, которые вводят BI-системы для принятия каких-то решений, готовы к этому шагу. Потому что источники могут быть абсолютно разных форматов, баз данных как таковых может не быть, они могут быть на разных платформах, это могут быть внешние данные которые в формате JSON, xml, или еще каких-то форматах. Не всегда возможно ограничить поиск и приходится забирать все данные, чтобы просто посмотреть, что из этого можно получить.
Второй важный момент – не всегда можно выгрузить нужные данные, потому что непонятен запрос от бизнеса. Было бы хорошо, если бы заказчик приходил и говорил – «я хочу увидеть конкретно вот этот показатель, чтобы на его основании принимать решения». Как правило, запрос ставится более общий – «я хочу, чтобы мы …. (далее можно подставить любой запрос), сделайте мне вот так вот». А что для этого нужно, какие именно для этого нужны данные, какие метрики нужно отслеживать и откуда их брать – это уже задача бизнес-аналитика и аналитика данных. Этот этап – этап сбора данных из всех источников, консолидация.
Когда мы собрали данные (которые могут быть абсолютно разнородными), мы обращаемся к BI-системам, которые позволяют привести каждый источник к единому виду, сделать так называемую «нормализацию данных», выделить какое-то ключевое значение, по которому мы из разных информационных систем сможем их между собой сопоставить (ETL-обработка, процесс транспортировки данных. ETL расшифровывается как extract, transform, load, то есть «извлечь, трансформировать, загрузить»). Этот процесс может идти как внутри BI-системы, так и вне ее – на этапе составления витрины данных, на этапе получения данных из информационных систем, возможен гибкий подход.
Далее идет структурирование данных, агрегирование данных в машинном формате, что позволяет привести их к тому виду, в котором данная BI-система может их прочитать и обработать.
Этап анализа. Это как раз работа аналитика данных – поиск гипотез и закономерностей.
Прежде чем мы получаем красивый отчёт, который отдаём руководству, мы зачастую работаем с обычными плоскими таблицами, прорабатываем какие-то гипотезы. Например, увидели, что в июне был всплеск посещаемости какого-нибудь точки продаж. Смотрим – а это всегда так в июне, это циклический процесс, из года в год, или у нас что-то произошло? Необходимо посмотреть исторические данные. Если оказывается, что это сезонность, то есть всё нормально, уже можно использовать эту информацию для дальнейших прогнозов. А если это отклонение – смотрим на рынок, что происходило, была ли какая-то нестандартная ситуация в стране или в мире, и так далее. То есть проходим большой этап подготовки, в результате которого получается аналитический отчёт, на выходе содержащий значения, таблицы, являющиеся ключевыми для организации. На основании таких отчетов принимаются управленческие решения – как компания будет развиваться дальше, что нужно поменять, какой-то процесс, цепь поставок, потому что у нас слишком долгая закупка оборудования, а может быть нужно поменять подрядчика, потому что он не выдерживает сроки, и т д.
Визуализации, такие как графики и инфографика, могут связывать элементы данных и представлять их таким образом, чтобы их взаимосвязи были более очевидными, статистические процессы могут дать нам представление о том, насколько надежны эти выводы, а инструменты онлайн-аналитической обработки (OLAP) помогают углубляться в данные, исследуя взаимосвязи, которые не были сразу очевидны без детального или агрегированного анализа.
Мониторинг, еще одна функция BI, позволяет с помощью данных рассматривать и корректировать бизнес в реальном времени, вносить коррективы, выявлять текущие проблемы.
Предиктивная аналитика на основе данных позволяет предсказать будущее компании и повлиять на него.
От того, насколько качественно был проведен шаг анализа данных, насколько правильно подобраны показатели, которые поступили в отчёт, будет зависеть то, как будет развиваться компании, насколько правильные и оперативные решения будут приняты для предотвращения каких-либо ситуаций.
Продолжение следует.
Магистратура ВИШ МИФИ готовит специалистов в области цифровой трансформации жизни, цифровой трансформации экономики, цифровой трансформации технологии и индустрии.