588 читали · 2 года назад
На каких бесплатных инструментах строить Observability и зонтичный мониторинг: ELK vs Graylog vs Grafana Loki vs Monq
Сами по себе логи, трейсы, метрики - это очень узкие артефакты состояния нашего объекта наблюдения и обслуживания. Для понимания общей картины нужен взгляд сверху, сбор всех важных сигналов в одну систему и работа с большими данными в ней. Зонтичный подход близок по своим целям к RED и Golden Signals, но по своей сути является противоположным по принципу работы с данными. В Golden Signals мы отслеживаем Latency, Traffic, Errors отдельных сервисов и по ним можем быстро, но очень поверхностно определить их состояние...
165 читали · 1 год назад
Построение системы мониторинга логов на основе SQL с ClickHouse и Grafana
Создание эффективной и масштабируемой системы мониторинга — задача, стоящая перед многими компаниями. Эта статья описывает опыт автора в создании такой системы с использованием ClickHouse как хранилища данных и Grafana для визуализации. Здесь вы найдете анализ различных технологий, описание конечного решения и основные выводы. На протяжении последних шести месяцев автор работал над экспериментальным проектом мониторинга для инфраструктуры компании. Работа началась с анализа существующих решений и в итоге остановилась на связке ClickHouse + Grafana...
964 читали · 3 года назад
Мониторинг Proxmox в Grafana
В этой статье Расскажу как настроить мониторинг хостов/кластера Proxmox и отображать в Grafana состояние запущенных контейнеров и виртуальных машин. Как запустить мониторинг Grafana/Prometheus за 5 минут можно прочитать в статье У тебя есть метрики? Дай! Настройки Proxmox VE На хосте Proxmox создадим группу и пользователя для мониторинга и назначим соответствующую роль pveum groupadd monitoring -comment 'Monitoring group' pveum aclmod / -group monitoring -role PVEAuditor pveum useradd pve_exporter@pve pveum...
956 читали · 3 года назад
"У тебя есть метрики? Дай!" Или мониторинг с помощью Prometheus и Grafana за 5 минут
Теорию о пользе и важности мониторинга я опущу. Расскажу на практике: утечка трафика, которую я случайно обнаружил в январе - с монторингом не случилась бы в принципе. Мониторинг может рассылать уведомления о превышении каких-то параметров, а расследование причин в моем конкретном случае заняло бы пару минут, а не часов. TL:DR Подробнее Общая схема Вариантов реализации много, я использовал два, а подробно разберу один: Докер Делать будем все в контейнерах докера - самый простой и быстрый способ...