Мой файловый сервер просто упал, и я не могу понять почему. Возможно, я наивен, но когда такое случается, я обычно могу просмотреть журнал событий системы, приложения или безопасности и найти виновника - но на этот раз мне не повезло.
Пока меня не было в офисе, я получил уведомление Icinga, в котором говорилось, что диск E: \ на моем сервере предупреждал о том, что для этого диска нет информации.
Я зашел на сервер и увидел, что диск E: \ был там, но под ним не было «графа хранилища», как обычно, и щелчок по нему повесил ОС. Затем я попытался перезагрузить сервер, и зависание продолжалось. Я выпустил stop-computer server -Force
команда, которая, казалось, начала работать, однако экран завис с сообщением: «Подождите, пока служба уведомлений о системных событиях». Мне пришлось принудительно завершить работу сервера, что никогда хорошая вещь.
У меня вопрос: если в средстве просмотра событий нет диагностики, можно ли куда-нибудь после инцидента обратиться, чтобы узнать, что вызвало сбой? У меня никогда не было блокировки сервера, как этот, поэтому я хотел бы знать, в чем заключалась основная проблема.
FYI - для любого гостя VMWare, если вы хотите получить дамп памяти, вы можете сделать снимок, а затем использовать vmss2core.exe для извлечения памяти в традиционный файл дампа памяти Windows, который можно прочитать с помощью windbg, и, следовательно, поддержка MS или другие квалифицированные люди.
Преобразование файла моментального снимка в дамп памяти с помощью инструмента vmss2core (2003941)
http://kb.vmware.com/kb/2003941
Снимок следует удалить после того, как дамп был создан, скопирован и преобразован. Обычно это предпочтительнее переключателя среды 1/0, если вы действительно хотите исследовать текущее состояние системы во время зависания. Это также проще и менее навязчиво, если вы просто хотите получить дамп памяти работающей системы без использования последовательности клавиатуры Windows для принудительного отображения синего экрана, который будет работать оптимально только в том случае, если желаемый дамп памяти был включен и последовательность клавиатуры была включена .
Без memory.dmp (который не был бы создан, потому что вы инициировали завершение работы), я не думаю, что есть что-то определенное, что вы можете сделать после смерти. Если только вы не запускали perfmon или что-то подобное и не смогли найти метрику, указывающую на проблему.
Какой на нем диск E: \?