Найти тему
VK Cloud

6 главных метрик для наблюдения за кластером Kubernetes

Работа с Kubernetes усложняется тем, что это не единая система, а сочетание нескольких компонентов. И от каждого их них поступает огромное количество метрик, в которых легко запутаться. Мы перевели статью, чтобы выяснить, на какие именно метрики стоит обращать внимание в первую очередь.

Для того чтобы грамотно мониторить рабочие нагрузки и поддерживать кластеры в исправном состоянии необходимо установить kube-state-metrics и Prometheus. Это поможет собирать и хранить выдаваемые метрики. Из материала вы узнаете самое главное о следующих метриках:

  • CPU / Memory Requests vs Actual Usage
  • CPU / Memory Limit vs Actual Usage
  • Percentage of Unavailable Pods Out of Desired Replicas
  • Desired Replicas Out of HPA Maximum Replicas
  • Nodes Failing Status Checks
  • Persistent Volume Utilization

Полный текст статьи — в нашем блоге на Хабре.