Один из серверов HPE Proliant DL360 Gen9 при перезагрузке по питанию начал сыпать странными ошибками в лог. Uncorrectable Machine Check Exception (Board 0, Processor 1, APIC ID 0x00000000, Bank 0x00000012, Status 0xBE200000'000C110A, Address 0x00000000'93000000, Misc 0x80FC3816'00402086) Ошибка только на первом процессоре, причём не всегда. Дальше сервер загружается и даже работает. Но неприятно. Ясно что проблема на стыке CPU1 - материнская плата - память. Действовать в этом случае нужно по простому плану. Начнём с первых двух пунктов, их можно совместить. Выполним обслуживание сервера и поменяем процессоры местами. Выключаем сервер, снимаем кроссировки, отключаем питание, снимаем крышку, откручиваем радиаторы. Осматриваем процессор, смотрим как нанесена термопаста. Снимаем термопасту. Я пользуюсь салфетками и спиртом. Это нужно для того, чтобы не пачкаться при снятии процессора. Процессоры чистые, извлекаем их. Сразу чистим. Доступны сокеты. Внимательно их осматриваем. Если кто-то уж