Найти в Дзене
Postgres DBA

PG_HAZEL : Чек-лист инфраструктуры СУБД при инциденте производительности. Случай №2 - CPU + RAM.

Практическое применение методики анализа состояния инфраструктуры при решении инцидентов производительности СУБД.
Оглавление
Анализ метрик сервера не менее важен , чем анализ метрик СУБД
Анализ метрик сервера не менее важен , чем анализ метрик СУБД

Задача

Практическое применение методики анализа состояния инфраструктуры при решении инцидентов производительности СУБД.

Предыдущие работы по теме

Инцидент

-2

1.Операционная скорость

Ось X - точка наблюдения в течении часа до инцидента. Ось Y - операционная скорость. Красный график - линия регрессии
Ось X - точка наблюдения в течении часа до инцидента. Ось Y - операционная скорость. Красный график - линия регрессии

2.Ожидания СУБД

Ось X - точка наблюдения в течении часа до инцидента. Ось Y - Ожидания СУБД. Красный график - линия регрессии
Ось X - точка наблюдения в течении часа до инцидента. Ось Y - Ожидания СУБД. Красный график - линия регрессии

3.Регрессионный и корреляционный анализ

-5

Используемые методики для формирования чек-листов

4.Чек-лист IO

-6

IO - OK

5. Чек-лист CPU

-7
-8
-9
-10
-11

CPU - есть проблемы

  • Переключения контекста могут быть вызваны прерываниями.
  • Возможно проблема в пользовательском приложении(resource contention).
  • Ядро тратит много времени на переключение контекста и планирование, вместо полезной работы.

6.Чек-лист RAM

-12
-13

RAM - есть проблемы

  • Свободная RAM менее 5%

Продолжение