Amazon Web Services (AWS) запустила сервис DevOps Guru, который позволяет автоматически выявлять проблемы в работе приложений и давать рекомендации по их устранению. Многолетний опыт по созданию, масштабированию и обслуживанию приложений сбора и анализа данных с использованием машинного обучения (ML) позволил AWS создать специализированные ML-модели для обнаружения неполадок, их устранения и предотвращения проблем до того, как они станут значимыми для потребителя. Если обнаруживается что-то необычное, указывающее на перебои в работе или сбои в обслуживании, такие как повышенная частота ошибок, задержки, нехватка ресурсов, то они помечаются с помощью службы уведомлений Amazon SNS и партнёрских средств интеграции. Затем DevOps Guru оценивает потенциальные последствия и причины проблемы, а также даёт конкретные рекомендации по их исправлению. Это позволяет пользователям избежать «холодных» перезапусков каждый раз, когда возникает какая-либо проблема, и повысить доступность своих приложени