Оригинал статьи: https://www.forbes.com/sites/forbestechcouncil/2019/01/04/three-next-practices-that-leverage-ai-and-machine-learning/#15e81ad16071
Об авторе: Ашок Сантанам (Ashok Santhanam). Соучредитель и CEO FogLogic, SaaS-стартапа по использованию ИИ для автоматизации ИТ-операций для корпоративных приложений; Силиконовая долина.
Будучи ИТ-директором или любым другим ИТ-руководителем, вы испытываете постоянное давление, чтобы обеспечить максимальную производительность ИТ-систем вашей компании. Системы должны соответствовать постоянно растущим требованиям по производительности, доступности и безопасности – наверняка вы уже смирились с тем, что обратной дороги нет. Постоянно приходится иметь дело с недостатком навыков и специалистов при всё растущем количестве трендов – облачной миграции, цифровой трансформации, интеграций систем при слияниях и поглощениях и других стратегических проектов. Чтобы с достоинством встретить все эти новые вызовы, нужно думать об использовании “следующих практик”, практик будущего, а не "лучших из существующих". Что это значит?
Темпы, с которыми в современной, всё более и более “цифровой”, среде, происходят изменения показывают: то, что хорошо работало раньше (“лучшие практики”) в скором времени совершенно перестанет работать. Это рождает концепт “практик будущего” или “следующих практик”. “Практики будущего” не концентрируются на усовершенствовании существующих методик, так как в текущей ситуации те устаревают слишком быстро. Вместо этого, они концентрируются на способах переосмысления процессов на будущее, используя методы искусственного интеллекта и машинного обучения, делая отдельные процессы “умными”.
Ниже приведено три взаимосвязанных примера того, как “практики будущего”, основанные на ИИ, могут применяться для обнаружения и разрешения различных инцидентов – или даже для устранения ограниченной управляемости текущего процесса в целом. Они способны преобразовать ваши процессы, позволяя одновременно достигать текущих целей и планировать масштабируемость на будущее.
Избыток сообщений об ошибках
Первый шаг поддержания жизнеспособности всех ваших ИТ-систем - это мониторинг. Сейчас системы работают так, что ваша команда получает уведомление о каждом небольшом сбое в работе системы, т.е. о каждом превышении порогового значения, зафиксированного инструментами мониторинга. Так как для мониторинга всё растущих масштабов системы, используется масса не особенно “умных” инструментов из прошлых эпох, ваша команда постоянно получает шквал сообщений об ошибках, большинство из которых игнорирует чисто рефлекторно. Помимо риска пропустить косвенное предупреждение о большой проблеме в будущем, есть риск слишком сильно отреагировать на то, что проблемой не является – и то, и другое, может сильно повредить продуктивности команды и уровню обслуживания.
Вместо этого, сегодня можно использовать инструменты искусственного интеллекта и машинного обучения для “умного” обнаружения сбоев – команда получает сообщения только тогда, когда необходимо реальное вмешательство. ИИ и МО могут быть использованы для изучения и профилирования поведения системы, позволяют автоматически определять и корректировать динамические пороговые значения, вызывающие уведомления, беря в основу статистические отклонения от ожидаемого поведения. ИИ также способен приоритезировать и оценивать эти отклонения, учитывая различные факторы (величина, частота и кластеризация аномалий). Это позволяет команде работать только с тем, что действительно требует внимания специалиста.
Разобраться в данных
Другое испытание для вашей команды – это определение корня неисправности для быстрого возвращения в рабочий режим. Выделение первопричины сегодня чрезвычайно сложно, так как не существует эффективного и повторяемого способа разобраться во всём том многообразии и объёме данных о системе, поступающих от всевозможных инструментов мониторинга. Кроме того, у всех в команде (включая подрядчиков на аутсорсе) разный и зачастую изолированный опыт – такой “разум племени” серьёзно усложняет получение взвешенного целостного представления о проблеме и подвергает сомнению результаты анализа.
Напротив, искусственный интеллект и машинное обучение разбирается в данных автоматически, контекстуализирует анализ инцидентов и помогает выделить первопричину быстро и не прибегая к “коллективному разуму”. ИИ/МО хорошо использовать для сужения круга потенциальных первопричин – применяемые алгоритмы определяют метрические корреляции, взаимосвязь нескольких неполадок или сезонные колебания, опираясь на аналитику временных рядов и журналов (логов). В дальнейшем это может быть использовано для формирования ограниченного набора рекомендованных действий по исправлению определённой неполадки.
Уход от метода проб и ошибок
Но в конце концов все инциденты решаются методом проб и ошибок. Этот процесс затратен по времени и непредсказуем по части результатов и их повторяемости. Вместо этого можно объединить методы машинного обучения и искусственного интеллекта с технологиями сотрудничества для проактивного устранения неполадок. Сущность сотрудничества (например, сообщения в чате, которыми обмениваются члены команды) может, в свою очередь, обеспечить возможность обучения в замкнутом контуре, где информация о том, сработало ли решение никуда не теряется, а попадает обратно в базу знаний – это улучшит алгоритмы автоматических рекомендаций. Охотно верится, что это может положить базу для новых “самоисцеляющихся” систем.
В заключение
Практики будущего – среди которых применение искусственного интеллекта и методов машинного обучения в критически важных процессах управления ИТ-системами – не просто постепенно упорядочивают и развивают ваши текущие процессы. Они преобразуют то, как вы организуете ИТ-операции и расширяют границы того, что поддаётся контролю и управлению.