Найти в Дзене

Сервер ребутится сам по себе? Возможно, он просто "кипит" 🔥

Знакомая ситуация: сервер работает, всё хорошо, но вдруг — зависание или перезагрузка без единой ошибки в логах. Частый виновник — перегрев. Процессор или диск нагреваются, срабатывает тепловая защита, и система вырубается, чтобы не сгореть. Как узнать температуру до того, как всё упадёт? Щупать радиатор рукой — метод ненадёжный. В Linux есть простые и бесплатные инструменты. Создаём скрипт, который раз в 15 минут проверяет температуру и пишет в лог (или шлёт уведомление), если что-то нагрелось выше нормы. В статье есть готовый код с порогами срабатывания. Шпаргалка по командам и нормативам — в полной версии. 📖 Читать и настраивать: andko.ru/temperature-monitoring-in-linux/ P.S. Один перегретый сервер может испортить не только ваш выходной, но и данные клиентов. Проверьте температуру сегодня, чтобы завтра не было сюрпризов. #linux #мониторинг #температура #администрирование #сервер #sysadmin
Оглавление

Знакомая ситуация: сервер работает, всё хорошо, но вдруг — зависание или перезагрузка без единой ошибки в логах. Частый виновник — перегрев. Процессор или диск нагреваются, срабатывает тепловая защита, и система вырубается, чтобы не сгореть.

Как узнать температуру до того, как всё упадёт? Щупать радиатор рукой — метод ненадёжный. В Linux есть простые и бесплатные инструменты.

Что ставим и как смотрим:

  1. Процессор и система — lm-sensorsbashsudo apt install lm-sensors
    sudo sensors-detect
    # отвечаем YES
    sensors
    # смотрим температуру ядер
    Норма:
    до 60°C в покое, до 80°C под нагрузкой.
  2. Жёсткие диски — hddtemp или smartctlbashsudo apt install hddtemp
    sudo hddtemp /dev/sda
    Норма для HDD: до 45–50°C. Для SSD: до 60–70°C.

Автоматизация (чтобы не проверять вручную)

Создаём скрипт, который раз в 15 минут проверяет температуру и пишет в лог (или шлёт уведомление), если что-то нагрелось выше нормы. В статье есть готовый код с порогами срабатывания.

Шпаргалка по командам и нормативам — в полной версии.

📖 Читать и настраивать: andko.ru/temperature-monitoring-in-linux/

P.S. Один перегретый сервер может испортить не только ваш выходной, но и данные клиентов. Проверьте температуру сегодня, чтобы завтра не было сюрпризов.

#linux #мониторинг #температура #администрирование #сервер #sysadmin