Наш сервер Supermicro SYS-6016T-U часто дает сбой из-за https://bugs.centos.org/view.php?id=10642 .
Поскольку запись на диск невозможна, информация о сбое не сохраняется. Я также не могу войти, используя IPMI
kvm console или ssh
для запуска dmesg.
Как настроить его так, чтобы ошибки сохранялись в каком-нибудь сетевом месте? (фактически, NetworkManager
тоже вылетает, поэтому сетевая карта может потерять свой конфиг) А может в устройстве ipmi есть какой-то буфер для этого?
Я совершил ошибку и зарезервировал 100% дискового пространства для программного рейда. Не уверен, что сейчас могу использовать kdump
Я думаю, вам стоит попробовать настроить kdump. Он довольно хорош в том, что делает, поскольку он запускает новое ядро, чтобы фиксировать состояние старого. Я использовал его для сбора данных о сбоях ядра, которые позже были использованы RH для исправления ошибки kenel.
Похоже, что есть способ решения проблемы, с которой вы столкнулись, - понизьте версию ядра до 3.10.0-229.4.2.