Работа с Kubernetes усложняется тем, что это не единая система, а сочетание нескольких компонентов. И от каждого их них поступает огромное количество метрик, в которых легко запутаться. Мы перевели статью, чтобы выяснить, на какие именно метрики стоит обращать внимание в первую очередь.
Для того чтобы грамотно мониторить рабочие нагрузки и поддерживать кластеры в исправном состоянии необходимо установить kube-state-metrics и Prometheus. Это поможет собирать и хранить выдаваемые метрики. Из материала вы узнаете самое главное о следующих метриках:
- CPU / Memory Requests vs Actual Usage
- CPU / Memory Limit vs Actual Usage
- Percentage of Unavailable Pods Out of Desired Replicas
- Desired Replicas Out of HPA Maximum Replicas
- Nodes Failing Status Checks
- Persistent Volume Utilization
Полный текст статьи — в нашем блоге на Хабре.