12 подписчиков

Рик говорит: Load Average в Linux — разжёвываю для особо тугих

7 января7 янв

1 мин

Эй, пацаны, слушайте сюда! Сегодня дед Рик объяснит вам, что такое Load Average в Linux. Не вздумайте путаться — это не какой-то там процент загрузки процессора, как некоторые дебилы думают. Нет, это среднее количество процессов, которые либо уже в деле (состояние R — running), либо ждут своих ресурсов (состояние D — uninterruptible sleep), скажем, пока диск что-то там обработает. И считается это за последние 1, 5 и 15 минут. Понимаете, если у вас сервер с тысячей процессоров и Load Average показывает 900, 900, 900 — это ещё ничего, вполне себе норм. Система просто параллельно ворочает тысячу задач. А вот если у вас сервак на четырёх ядрах и там такие же цифры — всё, пипец, катастрофа! Система перегружена, не справляется. А ещё фишка в том, что процессы в состоянии D (те, что в «беспробудном сне» и ждут дискового I/O, например) тоже учитываются в Load Average. Поэтому, если видите высокий показатель, не спешите орать: «Процессор перегружен!» Может, у вас просто диск тормозит или NFS л

Понимаете, если у вас сервер с тысячей процессоров и Load Average показывает 900, 900, 900 — это ещё ничего, вполне себе норм. Система просто параллельно ворочает тысячу задач. А вот если у вас сервак на четырёх ядрах и там такие же цифры — всё, пипец, катастрофа! Система перегружена, не справляется.

А ещё фишка в том, что процессы в состоянии D (те, что в «беспробудном сне» и ждут дискового I/O, например) тоже учитываются в Load Average. Поэтому, если видите высокий показатель, не спешите орать: «Процессор перегружен!» Может, у вас просто диск тормозит или NFS лагает.

Как это диагностировать? Держите, пацаны, мои любимые команды:

1. top — смотрите колонку с CPU (%us, %sy, %wa). Там увидите, кто и сколько жрёт ресурсов.

2. iostat -x 1 — глядите на %util и await. Это покажет, как ваш диск работает, нет ли там заторов.

3. vmstat 1 — смотрите поля r (число процессов в runnable состоянии) и b (процессы в uninterruptible). Это даст вам представление о том, что творится в системе.

DevOps-инженер, слушай сюда: ты должен уметь отличать «здоровую» нагрузку от «больной». «Здоровая» — это когда у тебя на многопроцессорной системе полно R-процессов, и все работают как надо. «Больная» — когда у тебя куча D-процессов, и всё из-за проблем с диском.

И ещё, пацаны, запомните: Load Average не подстраивается под количество ядер. Это абсолютное число, и его надо всегда рассматривать в контексте вашей аппаратуры. Не забывайте смотреть, с чем имеете дело!

Хэштеги: #Linux #LoadAverage #DevOps #Сервер #Диагностика

Советы от деда Рика:

1. Не путай Load Average с процентом загрузки CPU.

2. Всегда учитывай количество ядер при анализе Load Average.

3. Используй команды top, iostat и vmstat для детальной диагностики.

4. Учись отличать «здоровую» нагрузку от «больной».

5. Не игнорируй проблемы с I/O — они могут быть причиной высокого Load Average.