{"draftJsState":{"blocks":[{"data":{"image":{"id":"698c6e5bd389c17d75d4416e"}},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Кейс: 2:43 ночи. Телефон вибрирует. Открываю — «CRIT: CPU на веб-сервере 92%». Пока тер глаза, пришло еще 3 сообщения. «OK: CPU 48%», снова «CRIT: 89%», «OK: 51%». Утром смотришь историю — сервер даже не крякнул. Просто процесс сбора метрик совпал с пиком.","type":"atomic:image","key":"a3q1r"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":13,"offset":26,"style":"BOLD"}],"text":"Это классическая проблема flappy alerts. Давайте разбираться.","type":"unstyled","key":"50lk2"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Почему это вообще происходит? \uD83E\uDD14","type":"header-two","key":"fjpl7"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Zabbix увидел значение выше порога — создал проблему. Через минуту значение упало — закрыл. Еще через 30 секунд снова выше — открыл. Со стороны мониторинга это выглядит как бессмысленная нагрузка на базу и нервы.","type":"unstyled","key":"84hjh"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":10,"offset":0,"style":"BOLD"}],"text":"Проблема: триггер срабатывает на каждый чих, потому что у него нет «буферной зоны».","type":"unstyled","key":"ehjge"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Решение: добавляем гистерезис / hysteresis","type":"header-two","key":"81pba"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":11,"offset":0,"style":"BOLD"}],"text":"Гистерезис — это разные условия для открытия и закрытия проблемы.","type":"unstyled","key":"ejaqh"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Простой пример:","type":"unstyled","key":"8vdo1"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":20,"offset":0,"style":"BOLD"}],"text":"Открываем проблему: CPU > 90%","type":"unordered-list-item","key":"fkrki"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":19,"offset":0,"style":"BOLD"}],"text":"Закрываем проблему: CPU < 70%","type":"unordered-list-item","key":"3tpbg"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Между 70% и 90% — серая зона. Там ничего не происходит. Сервер может спокойно дышать, а админ — спать.","type":"unstyled","key":"5u1hk"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Как это выглядит в Zabbix (код)","type":"header-three","key":"94tik"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":3,"offset":8,"style":"BOLD"}],"text":"Триггер без гистерезиса (боль):","type":"unordered-list-item","key":"5vc56"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"{Template OS Linux:system.cpu.util[,idle].last()} < 10","type":"blockquote","key":"d4nhs"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"","type":"unstyled","key":"2teh6"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":1,"offset":8,"style":"BOLD"}],"text":"Триггер с гистерезисом (кайф):","type":"unordered-list-item","key":"9l7sg"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"{Template OS Linux:system.cpu.util[,idle].last()} < 10","type":"blockquote","key":"6viq4"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"and","type":"blockquote","key":"2jm5s"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"{Template OS Linux:system.cpu.util[,idle].prev()} < 15","type":"blockquote","key":"cajst"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Что тут происходит?","type":"header-three","key":"74rpf"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":7,"offset":25,"style":"BOLD"}],"text":"Проблема возникнет, если текущее значение idle < 10% (CPU > 90%)","type":"unordered-list-item","key":"cr6pf"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":10,"offset":33,"style":"BOLD"}],"text":"Проблема закроется, только когда предыдущее значение idle > 15% (CPU < 85%)","type":"unordered-list-item","key":"cv858"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Zabbix не тупит — он помнит предыдущее значение. Мы используем `.prev()` как триггер восстановления.","type":"unstyled","key":"6qgia"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Защита от кратковременных скачков","type":"header-three","key":"82f4n"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Допустим, у вас высоконагруженная система, и кратковременные пики до 95% — норма. Но если CPU валится в пол на 5 минут — это уже беда.","type":"unstyled","key":"56hf5"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"min({Template OS Linux:system.cpu.util[,idle].avg(5m)}, 5) < 10","type":"blockquote","key":"9ann5"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"","type":"unstyled","key":"110q1"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":11,"offset":23,"style":"BOLD"}],"text":"Проблема — только если минимальное значение idle за последние 5 минут было ниже 10%. Всплески на 10 секунд игнорируются.","type":"unstyled","key":"eidui"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Живой пример из конфига","type":"header-three","key":"b3nks"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":10,"offset":17,"style":"BOLD"}],"text":"Вот как выглядит правильный триггер для загрузки CPU в production:","type":"unstyled","key":"11gg4"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Имя: Высокая загрузка CPU на {HOST.NAME}","type":"blockquote","key":"5qjkq"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Выражение:","type":"blockquote","key":"9olgh"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"last(/Linux by Zabbix agent/system.cpu.util[,idle]) < {$CPU_CRIT}","type":"blockquote","key":"9k34b"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"and","type":"blockquote","key":"ddfnq"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"min(/Linux by Zabbix agent/system.cpu.util[,idle], 5m) < {$CPU_RECOVER}","type":"blockquote","key":"5i1se"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"{$CPU_CRIT} = 10 (CPU > 90%)","type":"blockquote","key":"5vs4p"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"{$CPU_RECOVER} = 20 (CPU < 80%)","type":"blockquote","key":"9ca61"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":7,"offset":14,"style":"BOLD"}],"text":"Мы используем макросы, чтобы не переписывать триггеры под каждую железку. Нагруженному БД-серверу можно подкрутить пороги, не отвязывая шаблон.","type":"unstyled","key":"b4bev"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Зависимости триггеров","type":"header-two","key":"cpr37"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Допустим, упал сам сервер. Zabbix честно создаст проблемы:","type":"unstyled","key":"3omu7"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Хост недоступен по ICMP","type":"unordered-list-item","key":"emohp"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Nginx не отвечает","type":"unordered-list-item","key":"dvjtj"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"PostgreSQL не отвечает","type":"unordered-list-item","key":"dfamt"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Диски не читаются","type":"unordered-list-item","key":"fprr0"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":13,"offset":18,"style":"BOLD"}],"text":"Дежурный получает 4 уведомления об одной проблеме.","type":"unstyled","key":"c75s0"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":23,"offset":0,"style":"BOLD"}],"text":"Лечится зависимостями: создаем триггер «Хост недоступен по ICMP» и делаем так, чтобы триггеры сервисов зависели от него.","type":"unstyled","key":"dj9b4"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"В конфигурации триггера Nginx:","type":"unstyled","key":"dnvl1"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Тип: Зависимость от","type":"blockquote","key":"48rb7"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Выражение: {Host:icmpping.last()} = 0","type":"blockquote","key":"1i3q9"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Если пинга нет — Zabbix молчит по остальным триггерам. Упал сервер, а не Nginx. Не плодим сущности.","type":"unstyled","key":"dohf3"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Резюме ","type":"header-two","key":"aqu3m"},{"data":{"image":{"id":"698c7060d389c17d75d7b3b2"}},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"","type":"atomic:image","key":"4huph"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"P.S. Код из поста можно копировать. Замените макросы под свои реалии.","type":"unstyled","key":"6f8mb"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"","type":"marker","key":"vv59rYvN4fJCjHTFi89d"}],"entityMap":{}},"mentions":[]}