У меня есть кластер Intel linux с интерфейсами IPMI на узлах. В последнее время интерфейсы IPMI работают нестабильно. Например, я больше не могу использовать команды IPMI для загрузки узлов PXE, а перезагрузка их через IPMI иногда работает, но не всегда.
Недавно я обнаружил, что вы можете протестировать шасси и BMC с помощью ipmitool, и вот результат:
# ipmitool chassis selftest
Self Test Results : device error
[FRU Internal Use Area corrupted]
# ipmitool bmc selftest
Selftest: device corrupted
Internal Use Area corrupted
Похоже, что-то пошло не так. Есть ли способ восстановить интерфейсы IPMI в исходное состояние? (Обратите внимание, что я не знаю, какое конкретное оборудование IPMI находится здесь, или как запросить их, чтобы узнать).
Сначала я бы попытался проверить это на других машинах того же типа - вполне возможно, что все ваши системы одного типа имеют какую-то странность ipmi, с которой ipmitool не может правильно справиться.
Перепрошивка прошивки / BIOS может помочь ... или принудительное отключение и включение машины - полное отключение от сети.
Какие это машины?
Бег ipmitool reset warm
или ipmitool reset cold
иногда может помочь.