Определить причины снижения производительности СУБД
Начало инцидента 07:05.
Характерные признаки в ходе инцидента - рост утилизации CPU и значений cpu iowait.
Результаты отчета
Определить причины снижения производительности СУБД
Начало инцидента 07:05.
Характерные признаки в ходе инцидента - рост утилизации CPU и значений cpu iowait.
Результаты отчета
...Читать далее
Оглавление
ℹ️Работы по проекту "PG_HAZEL"-завершены.Исследования продолжены в проекте PG_EXPECTOℹ️
Зри в корень ! Наука - поможет. Если есть инструмент.
Задача
Определить причины снижения производительности СУБД
Инцидент производительности СУБД
Дашборд мониторинга Zabbix
Начало инцидента 07:05.
Характерные признаки в ходе инцидента - рост утилизации CPU и значений cpu iowait.
Используемый отчет - make_summary_with_sql.sh
Результаты отчета
Аномалии(аварийные индикаторы)
Результат
ОК
Операционная скорость и корреляции ожиданий СУБД
Сильная корреляция с типом ожиданий IO
Результат
Наибольшая корреляция между ожиданиями СУБД и типом ожиданий IO.
Корреляция IO и метрик vmstat
Результат
OK
Статистический анализ метрик iostat для файловой системы /data
Результат
Проблемы производительности IO для устройства , для файловой системы /data:
- ALARM: более 50% наблюдений - Отклик на запись свыше 5мс
Признак не эффективного использование памяти для снижения нагрузки на диск:
- ALARM : Очень высокая корреляция (buff - r/s)
- ALARM : Очень высокая корреляция (buff - w/s)
- ALARM : Очень высокая корреляция (buff - wMB/s)
Статистический анализ метрик iostat для файловой системы /wal
Результат
Проблемы производительности IO для устройства , для файловой системы /wal:
- ALARM: более 50% наблюдений - Отклик на запись свыше 5мс
Признак не эффективного использование памяти для снижения нагрузки на диск:
- ALARM : Очень высокая корреляция (buff - w/s)
- ALARM : Очень высокая корреляция (buff - wMB/s)
Чек-лист IO
Результат
ОК
Чек-лист CPU
Результат
Высокое значение переключений контекста.
Чек-лист RAM
Результат
- WARNING: 25-50% наблюдений - свободная RAM менее 5%
Результат статистического анализа производительности , ожиданий СУБД и метрик vmstat+iostat
Снижение производительности и рост ожиданий типа IO сопровождается ростом времени ожидания записи для устройств, используемых для файловых систем /data и /wal .