Найти в Дзене

Реанимация NVMe диска в Linux

Имеется сервер с операционной системой Oracle Linux. В сервере два NVME диска Samsung, которые объединены в зеркальный RAID1 массив. Samsung SSD 12.8TB PCIe MZPLL12THMLA-00005 Один из NVMe дисков на сервере перестал работать. Диск пропал из ОС и из RAID, но после перезагрузки стал виден. Посмотреть информацию об NVMe дисках можно с помощью утилиты nvme из пакета nvme-cli: yum install nvme-cli
или
apt install nvme-cli
nvme list -o json Информация о диске выводится, это уже хорошо, значит, контроллер диска ещё работает. Но все партиции пропали, диск недоступен для записи. При попытке считать SMART лог получаем ошибку: nvme smart-log /dev/nvme0n1 NVME Status:NS_NOT_READY: The namespace is not ready to be accessed as a result of a condition other than a condition that is reported as an Asymmetric Namespace Access condition Понятно, что при обращении к namespace диска произошла какая-то ошибка. При этом SMART лог второго такого же диска прекрасно читается: nvme smart-log /dev/nvme1n1 Проб

Имеется сервер с операционной системой Oracle Linux. В сервере два NVME диска Samsung, которые объединены в зеркальный RAID1 массив.

Samsung SSD 12.8TB PCIe MZPLL12THMLA-00005

Один из NVMe дисков на сервере перестал работать. Диск пропал из ОС и из RAID, но после перезагрузки стал виден. Посмотреть информацию об NVMe дисках можно с помощью утилиты nvme из пакета nvme-cli:

yum install nvme-cli
или
apt install nvme-cli

nvme list -o json
-2

Информация о диске выводится, это уже хорошо, значит, контроллер диска ещё работает. Но все партиции пропали, диск недоступен для записи.

При попытке считать SMART лог получаем ошибку:

nvme smart-log /dev/nvme0n1

NVME Status:NS_NOT_READY: The namespace is not ready to be accessed as a result of a condition other than a condition that is reported as an Asymmetric Namespace Access condition
-3

Понятно, что при обращении к namespace диска произошла какая-то ошибка. При этом SMART лог второго такого же диска прекрасно читается:

nvme smart-log /dev/nvme1n1
-4

Пробую получить информацию о namespace проблемного диска:

nvme id-ns /dev/nvme0n1
-5

Информация выводится корректно. Получается, что контроллер диска работает, namespace есть, но почему-то не работает. Попробуем отформатировать NVMe диск. Речь идёт не о форматировании файловой системы, а о форматировании пространства (namespace).

Синтаксис команды:

nvme format <device> [--namespace-id=<nsid> | -n <nsid>]
[--lbaf=<lbaf> | -l <lbaf>]
[--ses=<ses> | -s <ses>]
[--pil=<pil> | -p <pil>]
[--pi=<pi> | -i <pi>]
[--ms=<ms> | -m <ms>]
[--reset | -r ]
[--timeout=<timeout> | -t <timeout> ]

Форматирую пространство с параметрами по умолчанию:

nvme format /dev/nvme0n1
-6

Отлично:

Success formatting namespace:1

Снова пробую считать SMART лог проблемного диска:

nvme smart-log /dev/nvme0n1
-7

Теперь лог читается. Диск успешно реанимирован, правда, он пуст.

Нужно заново создать раздел и добавить его в RAID1 массив как SPARE диск. RAID массив начнёт восстанавливаться.

-8

Через 1031 минуту целостность массива была восстановлена. Оба NVMe диска в строю.

Источник:
https://internet-lab.ru/nvme_format_ns

💰 Поддержать проект

Если вам понравилась статья, то ставьте 👍🏻 каналу.
Пишите комментарии, задавайте вопросы, подписывайтесь.