Найти в Дзене
Alarm System

Технология S.M.A.R.T. для диагностики здоровья HDD

SMART (Self-Monitoring, Analysis, and Reporting Technology) – это функция, встроенная в большинство современных жестких дисков и SSD, которая отслеживает различные атрибуты, такие как температура, ошибки чтения и время раскрутки. Эти атрибуты могут дать представление о здоровье и долговечности диска, позволяя пользователям предсказать потенциальные сбои и принять меры, например создать резервную копию данных или заменить диск до того, как произойдет катастрофический сбой. В видеорегистраторах производства компании ХМ не предусмотрена возможность диагностики здоровья HDD. Но как узнать, в каком состоянии сейчас ваш SSD? Для удовлетворения своего любопытства, либо из желания начать внимательно следить за своими накопителями, вы можете использовать инструмент мониторинга smartctl. Посмотреть значение S.M.A.R.T.  в видеорегистраторах ХМ xiongmaitech можно из главного меню веб интерфейса кликнув на меню SMART после чего отчет о состоянии жесткого диска отобразится в новой вкладке. Система S
Оглавление

SMART (Self-Monitoring, Analysis, and Reporting Technology) – это функция, встроенная в большинство современных жестких дисков и SSD, которая отслеживает различные атрибуты, такие как температура, ошибки чтения и время раскрутки. Эти атрибуты могут дать представление о здоровье и долговечности диска, позволяя пользователям предсказать потенциальные сбои и принять меры, например создать резервную копию данных или заменить диск до того, как произойдет катастрофический сбой.

В видеорегистраторах производства компании ХМ не предусмотрена возможность диагностики здоровья HDD. Но как узнать, в каком состоянии сейчас ваш SSD? Для удовлетворения своего любопытства, либо из желания начать внимательно следить за своими накопителями, вы можете использовать инструмент мониторинга smartctl.

В нашей прошивке для NVR NBD80X16S-KL уже имеется  этот инструмент.

Посмотреть значение S.M.A.R.T.  в видеорегистраторах ХМ xiongmaitech можно из главного меню веб интерфейса кликнув на меню SMART после чего отчет о состоянии жесткого диска отобразится в новой вкладке.

Выдача отчета «о всей S.M.A.R.T. информации о диске»

Система S.M.A.R.T. использует пять значений, по которым можно определить
состояние жесткого диска:
ID - идентификатор
Атрибут - имя атрибута
Значение - идентификатор атрибута
Худший - текущее значение атрибута
Порог - минимальное пороговое значения атрибута
RAW значение - абсолютное значение атрибута
Для разных дисков набор атрибутов может меняться, но основные атрибуты
присутствуют всегда.

Ключевое значение имеет содержимое 3-х столбцов:

  • VALUE - текущее значение параметра;
  • WORST - наихудшее значение, которого когда-либо достигало значение Value;
  • THRESH - значение, которое должен достигнуть Value этого же атрибута, чтобы состояние атрибута было признано критическим.

Критичным является поле WHEN_FAILED, если оно имеет значение FAIL, то высока вероятность выхода жесткого диска из строя в ближайшее время.

Интерпретация данных SMART

  • Raw_Read_Error_Rate: Высокие значения могут указывать на проблемы со способностью диска точно считывать данные.
  • Reallocated_Sector_Ct: Ненулевое значение может означать, что на диске начали появляться плохие сектора. Если это число продолжает расти, это может свидетельствовать о неисправности диска.
  • Power_On_Hours (часы включения): Общее количество часов, в течение которых диск был включен. Это может дать представление о возрасте диска.
  • Temperature_Celsius (температура по Цельсию): Высокая температура (выше 60 °C) может сократить срок службы диска. Лучше всего поддерживать температуру в диапазоне 30-40°C.
  • Набор атрибутов поддерживаемых конкретной моделью жесткого диска, даже если он минимален, позволяет с высокой достоверностью определить техническое состояние и перспективы эксплуатации устройства. Можно определить время нахождения во включенном состоянии. Интенсивность использования, температурный режим, негативные внешние воздействия – все эти факты легко отслеживаются по абсолютным значениям соответствующих атрибутов. Подобным же образом, можно оценить и уровень износа оборудования, качество поверхности и тракта записи/чтения. Таким образом, имеется возможность вовремя определить факт критического состояния накопителя.
  • Техническое состояние жесткого диска, не достигшее критического порога, характеризуется абсолютным значением атрибутов, отражающих счетчики сбоев, обнаруженных и исправленных оборудованием накопителя.
  • 001 ( 1 ) Raw Read Error Rate - абсолютное значение ошибок считывания. Существует некоторые отличия в формировании значения данного атрибута разными производителями. На практике, накопители Seagate могут иметь гигантское значение RAW этого атрибута, реально будучи в хорошем состоянии, а накопители Western Digital могут иметь его нулевым, имея критические показатели по другим характеристикам. Некоторые модели вообще могут не поддерживать данный атрибут.
  • 005 ( 5 ) Reallocated Sector Count - Количество переназначенных секторов. Ненулевое значение данного счетчика говорит о том, что были обнаружены дефектные блоки, данные которых перенесены в резервную область.
  • 196 ( C4 ) Reallocation Event Count - Число событий переназначения сбойных секторов. В поле raw value данного атрибута хранится общее число попыток переноса данных из нестабильных секторов в резервную область. Учитываются как успешные, так и неуспешные попытки.
  • 197 ( C5 ) Current Pending Sector Count - Текущее количество нестабильных секторов. Поле raw value этого атрибута показывает общее количество секторов, которые накопитель в данный момент считает кандидатами на переназначение в резервную область (remap). Если в дальнейшем какой-то из этих секторов будет прочитан успешно, то он исключается из списка кандидатов. Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить данные и перенести их в резервную область, а сам сектор пометить как переназначенный (remapped). Если значение атрибутов 5,196,197 увеличивается за короткий промежуток времени ( дни, или даже часы), то это является настораживающим признаком – либо ухудшаются технические параметры самого накопителя, либо сказывается влияние внешних воздействий.
  • 007 ( 07h ) Seek Error Rate - Частота появления ошибок позиционирования блока магнитных головок (БМГ). Большое значение говорит о проблемах механизма позиционирования, хотя может быть вызвано и внешними факторами, такими как перегрев или повышенная вибрация.
  • 008 ( 08h ) Seek Time Performance - средняя скорость позиционирования магнитных головок. Если значение атрибута уменьшается (замедление позиционирования), то велика вероятность проблем с механической частью привода головок.
  • 199 ( C7 ) UltraDMA CRC Error Count - Счетчик ошибок, возникших при передаче данных в режиме UltraDMA. Рост абсолютного значения указывает на проблемы при передаче данных контроллером диска в оперативную память. Чаще всего, вызвано плохим кабелем и нестабильным электропитанием.