В первых статьях я планирую поговорить о мониторинге.
Работая в it-компании и с ростом инфраструктуры передо мной была поставлена задача постановки на мониторинг системы для уведомления коллег о проблемах и оперативного их решения.
Про системы мониторинга много информации в интернете, хотел бы рассказать о своем выборе. Со времен работы сетевым инженером, (в дальнейшем планирую осветить эту тему тоже) я остановился на Zabbix из-за его масштабируемости и простоты, так как можно сделать мониторинг по готовым шаблонам или написать что-то вплоть до мониторинга логов о резервировании (да-да, он умеет вычитывать файлы, и мы без проблем можем повесить на это свой триггер). Если с нативными протоколами и шаблонами все ясно, то как обстоят дела с продуктовым мониторингом? Ведь при поддержке большого веб приложения, построенного на микросерверной архитектуре, мы можем столкнуться с ситуацией когда контейнеры работают штатно, но api методы не отрабатывают или отрабатывают некорректно, что приводит к недоступности части функционала в моменте времени или деградации системы.
Для этих целей будем использовать веб-мониторинг, о настройках которого много статей и видео, но зачастую они не раскрывают нюансы, а начнем мы пожалуй с азов мониторинга и постепенно будем рассматривать особенности системы и различные ситуации из моей практики.
Недавно на свет появилась 7 версия Zabbix, наконец то дождались поддержки синтетического мониторинга, в следующей статье хочу рассмотреть шаги по его развёртыванию так как информации на данный момент мало, а сложности присутствуют.