Постараемся разобрать как современные тенденции BI, так и исключительно отечественные сложности этого развития. Импортозамещение, свободно распространяемое ПО, возможности применения машинного обучения.
Системная аналитика — одна из наиболее активно развивающихся отраслей современного IT. И машинное обучение — не единственный и не главный аспект этого развития. В этой статье мы постараемся разобрать как современные тенденции BI, так и исключительно отечественные сложности этого развития. Импортозамещение, свободно распространяемое ПО, возможности применения машинного обучения: рассказывает Виталий Чесноков, генеральный директор и партнер цифрового интегратора QSOFT․
Современные тенденции в области работы с данными
Со временем в компаниях выросло количество информационных систем, отвечающих за различные участки бизнеса. Раньше управлять ими и объединять хранящиеся в них данные могли разработчики и администраторы, но постепенно их сложность, равно как и необходимость оперативного получения данных, потребовали привлечения отдельного специалиста – data-аналитика. Он отвечает за построение оптимального взаимодействия между информационными системами предприятия, проектирует правила хранения и обмена информацией, трансформирует требования бизнеса в функциональные, обеспечивает эффективность использования данных и их доступность для всех заинтересованных подразделений.
Широкое распространение работы с данными приводит к появлению отраслевых стандартов работы. По аналогии с набором практик для управления проектами PMBOK вышел набор стандартов DMBOK, уже в двух версиях. Появляются технические стандарты, которые условно можно назвать DataOps․ Начали проводиться конференции, где специалисты обмениваются опытом и агрегируют успешные практики в единые базы знаний.
Одновременно с этим появляются законы, регламентирующие правила сбора и обработки данных – в первую очередь, персональных.
Стандартом для бизнес-аналитики становится использование хранилищ OLAP (Online Analytical Processing): они хуже транзакционных баз справляются с быстрыми операциями чтения и записи, но отлично подходят для выборок и анализа больших массивов.
Еще одна важная современная тенденция – облачные инфраструктурные платформы с уже готовыми инструментами для быстрого развертывания хранилищ и работы с ними. Они сделали аналитическую работу с большими объемами данных доступной для любой организации: больше не требуется создавать собственную сложную инфраструктуру, достаточно воспользоваться сервисом, где все инструменты доступны «из коробки». Снизились требования к компетенции бизнес-аналитиков и экспертов, работающих с данными, поскольку BI-системы предоставляют множество готовых функций в части построения отчетов и визуализации данных (знание SQL перестает быть необходимостью, без которой нельзя сделать выборку данных). Подобные решения уже предлагают как западные компании – Google, Amazon – так и российские – “Яндекс”, “Вконтакте”. Это делает эффективную работу с большими объемами информации доступной для большего числа бизнесов, помогает расти культуре работы с данными.
В России основная текущая ИТ-тенденция — импортозамещение․ Российские компании выпустили несколько качественных замен зарубежных продуктов, они успешно внедряются крупными и небольшими компаниями. Можно отметить систему Visiology, позиционирующую себя как замена Power BI для среднего и крупного бизнеса. Analytic Workspace позволяет подключать множество источников данных и предлагает различные инструменты для визуализации “из коробки”. В области process mining стоит упомянуть российские решения Proceset от Infomaximum и недавно открытый для широкого использования Sber Process Mining․ Эти системы уже могут похвастаться успешными внедрениями в крупных компаниях финансового, промышленного и ИТ-секторов.
Решения с открытым исходным кодом
Также становятся все более функциональными BI-решения с открытым кодом. Писать собственное решение с нуля дорого, такая разработка оправдана только в случае жестких требований по импортозамещению или внутренних регламентов ИБ. Opensource системы можно настроить и при необходимости доработать под бизнес-процессы конкретной компании.
Так, на одном из наших проектов было необходимо внедрить решение для построения аналитики большого корпоративного портала, отвечающей на вопросы: насколько эффективна система с точки зрения быстродействия и отказоустойчивости, как порталом пользуются сотрудники, как ...