Найти в Дзене

Насколько критично использовать ECC-память для ZFS

Часть_2 В прошлой части мы рассмотрели общее влияние ошибок памяти на ZFS и выяснили, что риск возникновения таких ошибок невелик, а риск повреждения пользовательских данных еще ниже. А как быть с самой ZFS, может ли такая ошибка привести к полному разрушению или критическому повреждению файловой системы? Давайте снова обратимся к статистическому материалу от Google, который содержит данные о вероятности повреждения при возникновении ошибок памяти метаданных ZFS, что теоретически может привести (но не обязательно приведет) к повреждению структуры ZFS. ▫️ 1 DIMM – 0,0428% ▫️ 4 DIMM – 0,171% ▫️ 8 DIMM – 0,341% С одной стороны, это немного, например, для типичной системы с четырьмя модулями DIMM вероятность повреждения метаданных составит 0,17% в год или 1 случай из 585. Много это или мало? Для этого давайте сравним вероятность ошибки в памяти с другими событиями, потенциально могущими привести к потере пула, за основу возьмем систему с 4 DIMM и промежуток в 5 лет: ▫️Ошибка в метад

Насколько критично использовать ECC-память для ZFS. Часть_2

В прошлой части мы рассмотрели общее влияние ошибок памяти на ZFS и выяснили, что риск возникновения таких ошибок невелик, а риск повреждения пользовательских данных еще ниже.

А как быть с самой ZFS, может ли такая ошибка привести к полному разрушению или критическому повреждению файловой системы?

Давайте снова обратимся к статистическому материалу от Google, который содержит данные о вероятности повреждения при возникновении ошибок памяти метаданных ZFS, что теоретически может привести (но не обязательно приведет) к повреждению структуры ZFS.

▫️ 1 DIMM – 0,0428%

▫️ 4 DIMM – 0,171%

▫️ 8 DIMM – 0,341%

С одной стороны, это немного, например, для типичной системы с четырьмя модулями DIMM вероятность повреждения метаданных составит 0,17% в год или 1 случай из 585.

Много это или мало? Для этого давайте сравним вероятность ошибки в памяти с другими событиями, потенциально могущими привести к потере пула, за основу возьмем систему с 4 DIMM и промежуток в 5 лет:

▫️Ошибка в метаданных из-за не-ECC (4 DIMM) – 0,85%

▫️Отказ одного диска в RAID-Z1 – 5-14%

▫️Одновременный отказ 2 дисков в RAID-Z1 – 2,5%

▫️Ошибка администратора (rm -rf, zfs destroy) 2,5-9,6%

Как видим, вероятность разрушения ZFS по причине ошибки в памяти в несколько раз ниже вероятности выхода из строя сразу двух дисков в массиве и еще ниже возможной человеческой ошибки.

Но говорит ли это, что ECC -память для ZFS не нужна? Нет, раз в год и палка стреляет и если есть возможность использовать ECC, то ее нужно использовать. Если же нет, то стоит понимать, что у вас появляются дополнительные риски, которые следует учитывать.

Также следует понимать, что все сказанное выше относится к любой файловой системе, а не только ZFS.

Что касается ZFS, то воспринимать ее как панацею, обеспечивающую надежное хранение тоже не следует. Да, ZFS защищает ваши данные лучше, чем иные файловые системы, но она также имеет точки отказа и может подвергнуться сбоям.