Сервер дает сбой все чаще. До сбоя в журнале событий нет событий, указывающих на причину сбоя. Нет синего экрана, он не отвечает на пинги, ничего не показывает на KVM и т. Д.
У меня 2 вопроса.
1) Я настроил сервер для создания файлов дампа, поскольку мы не получаем информацию о событии vwr, которая указывает, почему он дает сбой. Есть ли хорошо способ узнать, как их просматривать и быстро находить проблемы? Я не работал с этим раньше.
2) Событие 106 появляется с некоторой частотой примерно за час до перезагрузки. Он находится на сервере 2003 (наш последний ... но это устройство, и мы все еще ждем способа его виртуализации) и показывает источник как WMIxWDM. Точный текст: «Сообщение о событии проверки машины - это исправленная ошибка» и отображается как предупреждение.
Кто-нибудь думает, что эта ошибка может способствовать сбою? Прямо сейчас у нас было 2 сбоя за столько же недель, до этого было ~ ежемесячно, а до этого было меньше.
Спасибо за любую помощь!
Поскольку вы видите исправимые исключения машинной проверки с некоторой частотой, наиболее вероятной причиной является отказ оборудования. Вам следует проверить журналы управления вашей основной платой (HP iLO, Dell DRAC, IBM Remote Supervisor и т. Д.) Или программное обеспечение для управления оборудованием, поставляемое с вашим сервером (HP Insight, Dell OpenManage и т. Д.), На предмет каких-либо аномалий.