Почему бизнесу важны большие данные, что в них такого интересного и полезного? Ответ очень прост – огромные массивы данных, собранные машинами, датчиками и прочим оборудованием с различных источников, дают представление о реальных событиях, поведении, изменениях и могут открыть непостижимые человеческому уму закономерности.
Большие данные дают возможность намного быстрее реагировать на разные аспекты деятельности и принимать решения, таким образом повышая эффективность бизнеса. Работа с такими массивами данных непроста, но в результате обработки больших данных вы можете увидеть и принять во внимание новые риски, обнаружить скрытые паттерны, сопоставить различные показатели и результаты в сотни раз быстрее, чем если бы этим занималась команда аналитиков.
С большими данными компании работают уже много десятилетий, но сам термин «большие данные» существует уже 20 лет. В некоторых областях большие данные позволяют получить существенные преимущества, как, например, в ритейле - понимание своего потребителя, что, безусловно, является немаловажным аспектом. Конечно, еще не все отрасли могут похвастаться глубоким проникновением технологии больших данных, например, строительство - в отдельных случаях, чтобы осуществить подходящую выборку данных для последующего анализа, требуется завершить строительство, а это долгосрочный процесс. А некоторые модели бизнеса основываются именно на анализе полученных больших данных.
Поближе рассмотрим несколько отраслей, которые успешно используют большие данные.
Сельские хозяйства
Big data широко используется в области сельского хозяйства – в дополнении с устройствами IoT (internet of things) система анализирует микроклиматические изменения при выращивании растений и сельскохозяйственных культур, и полученные данные собирает в режиме онлайн и далее анализирует для оперативного реагирования. Машинное обучение (maсhine learning) и алгоритмы можно настроить для учета любого объема информации или задач, чтобы моделировать различные прогнозы для планирования или принятия решений, с одной важной целью - понять, как окружающая среда и мир в целом влияет на их бизнес.
- Вклад в развитие человечества. Имея в виду, что проблема голодания в мире продолжает усугубляться, сельские хозяйства просто не смогут обойтись без современных технологий, чтобы прокормить растущее население. Различные датчики, установленные даже на комбайнах и прочей технике, помогают фермерам получать всестороннюю информацию о том, когда, где и как лучше выращивать растения, вплоть до последнего зернышка, таким образом повышая продуктивность и увеличивая урожайность.
Медиа-индустрия и маркетинг
Маркетинговые и медиа-компании отныне не могут представить ежедневную работу без анализа данных о потребителях и их поведении, следовательно, их деятельность напрямую зависит от использования технологий и решений больших данных.
- Ритейл. Маркетологи и пиарщики в компаниях уже давно и достаточно успешно используют большие данные для увеличения продаж. На основе таких данных, полученных от различных устройств, торговые центры, например, анализируют потоки клиентов, данные с карт лояльности, платежи и могут адаптировать время работы, рекламные кампании, различные акции под различные требования.
- Отличным примером адаптации данных для целенаправленной рекламной кампании является медиа-гигант Netflix, у которого на счету более 10 млн. подписчиков. История поиска и сами просмотры выбранных видео дают возможность компании определить, что именно интересно подписчику, и отправить ему предложение о следующем фильме, который он должен посмотреть.
Медицина
Анализ big data часто применяется в медицинских учреждениях, больницах, лабораториях. В точности и «правдивости» собранных данных и способности искусственного интеллекта содействовать медперсоналу и докторам мнения ученых и специалистов расходятся, так как доверить постановку диагноза машине – это смелый шаг. В растущем количестве медицинских данных, система помогает следить за состоянием пациента и соответственно помогать медперсоналу быстро получить необходимую информацию, сводку истории болезни, поставить быстрый диагноз или сравнить динамику анализов.
- Обработка снимков. Медицина насыщена снимками, картинками, фотографиями и рентгенами. До сих пор врачи мануально рассматривали каждый снимок пациента, но специалисты предполагают, что алгоритмы могут быть использованы, например, для первичной обработки снимков рентгена и определения диагноза.
- Прогнозирование потока пациентов. Объединяя усилия нескольких больниц, системы аналитики могут, например, прогнозировать пики и затишья в отделениях скорой помощи и регистратуре, а также избежать повторных или необоснованных ситуаций.
- Ведение учета медикаментов в больнице. Компания DEAC разработала и внедрила для своего клиента – региональной больницы – решение по учету всех находящихся в больнице медикаментов. Эта же система анализирует «обиход» лекарств в больнице по мере их использования, и автоматически отправляет поставщику заказы для своевременного пополнения запасов, таким образом избегая ситуаций, когда кто-то забыл заказать нужное пациенту лекарство.
Производство
Анализ больших данных может оказаться прорывом для производства, так как он позволяет более эффективно управлять и контролировать процессы. Машинные данные помогают не только своевременно оповестить о неисправностях техники, но и подсчитать оставшийся срок службы систем и компонентов, поддерживая их производительность в соответствии со спецификацией производителя.
- Точность в работе. Представьте фармацевтический завод: если какая-то деталь потеряла часть своей функциональности, но все еще работает, то машина может вводить больше или меньше активного ингредиента в лекарство.
- Без простоев. Сколько может стоить приостановление деятельности завода в связи с техническими неполадками? Если уведомления системы контроля и аналитики приходят вовремя и до возникновения возможного инцидента, то компания может успешно избежать неожиданных расходов.
Финансовый сектор и банки
Банки и финансовые институции оперируют большим количеством данных, которые также успешно используют для развития и продвижения бизнеса. Финансовые компании используют большие данные для принятия обоснованных инвестиций, которые с большой вероятностью могут принести прибыль.
В частности, существует 3 наиболее распространенные сферы использования больших данных в банковском и финансовом секторе:
1. Улучшение клиентского опыта
2. Эффективность работы сотрудников
3. Оптимизация операций
Большие данные в госсекторе
Накопленные каждый день госсектором данные (а их очень много) являются ценным активом для управления и контроля документооборота и баз данных, демографии страны, энергетических, географических ресурсов, транспортного сообщения, медицины, климатических наблюдений, экономических показателей и т.д. Из наиболее интересных случаев применения информационно-аналитических систем в госсекторе можно упомянуть несколько.
- «Почта России» в начале 2020 года внедрит аналитическую платформу на основе Big Data, которая будет направлена на получение оперативных данных в реальном времени по укомплектованности штата, загруженности, финансовых показателях и пр. Платформа также будет интегрирована с такими системами как управление электронной очередью и рабочим временем персонала.
- Внутренние информационные угрозы. Используя колебания и аномалии в поведении, службы безопасности могут идентифицировать и предотвратить различные угрозы, например, утечку данных, кибератаки, вредоносное программное обеспечение и пр.
- Использование камер видеонаблюдения. Классический пример использования большого потока данных. Системы распознавания и поиска лиц, фиксация нестандартного поведения, анализ трафика и пробок.
Моему бизнесу это было бы актуально. Что для этого нужно?
Шаг 1
В первую очередь, для такого объема данных потребуется внушительная система хранения и обработки данных. У больших данных есть тенденция расти быстрее, чем компания успевает их обработать и структурировать, применить, поэтому для работы с ними нужна эластичная платформа системы хранения данных (СХД), способная расти вместе с данными. Для сбора и хранения лучше всего использовать облачного провайдера, а обработку данных уже можно проводить на собственных ресурсах.
Например, облачная платформа с NoSQL базой данных Cassandra или InfluxDB (обе с открытым исходным кодом) способна ежесекундно получать данные от датчиков IoT и пр. NoSQL базы данных обеспечивают механизм хранения и извлечения данных и идеально подойдут для масштабируемых приложений.
Шаг 2
Далее популярные системы аналитики больших данных Hadoop, Apache Spark, Apache Storm, Apache Spark или Disco позволяют анализировать полученные огромные массивы данных параллельно.
Стоит отметить, что системы можно размещать как на облаке, так и на физических ресурсах, например, на кластере серверов. Что очень важно, выбирая мощное решение кластеризации, выбранные системы могут распределять большие данные на разные узлы внутри кластера, тем самым балансируя нагрузку и обеспечивая почти 100% доступность. Ведь главная задача кластера - исключить простой системы, связанный с любым возможным инцидентом - внешним вмешательством или сбоем во внутренней работе ресурса.
Шаг 3
После того как данные обработаны, дополнительно используются решения для интерактивной визуализации и бизнес-аналитики, например, PowerBI, которые позволяют интерпретировать данные и перейти от слов к действиям. Для поиска данных в системе, можно использовать популярную поисковую программу Elasticsearch для отбора и поиска данных, которые хранит система на SQL-сервере, в результате значительно упрощая поиск документов и сам документооборот.
__________________________
Послесловие
Малый бизнес часто пугает стоимость таких решений, но сегодня нет необходимости инвестировать и поддерживать дорогостоящее специализированное оборудование.
Можем смело сказать, что безусловно есть смысл внедрять технологии и в малый бизнес, но только если этот бизнес сам готов к анализу и использованию таких данных. Это решение на уровне управления, ведь в CRM-системах и различных других базах данных уже сегодня накапливается множество данных о потребителях продуктов, что может помочь улучшить продажи, работу техподдержки и другие бизнес-процессы. Вручную большие массивы данных никто анализировать не будет, в результате ценная информация зачастую так и «лежит» неиспользованная.
И еще. Решения больших данных косвенно влияют на доходность в долгосрочной перспективе, обеспечивая эффективную деятельность предприятию и конкурентоспособность на рынке. От того насколько «глубоко» предприятие планирует внедрять такие решения, а также для каждого конкретного предприятия, доходность будет отличаться.
Если Вам интересно узнать больше о возможностях работы с большими данными, можете посетить страничку DEAC или связаться с нашими экспертами онлайн!