Насколько я знаю, сервер в моей компании ведет себя странно. Поскольку это производственный сервер, мы редко выполняем полное выключение / перезапуск, но когда мы это делаем, в случайные моменты мы несколько раз получали BSOD, прежде чем он, наконец, загрузился обратно в Windows (ничего менять, просто нормальный сброс).
Я ожидал получить файл дампа после каждого BSOD, но, как ни странно, так и не получил его. Я много раз проверял конфигурацию запуска в предварительных настройках, чтобы убедиться, что он настроен на создание файла дампа, но до сих пор у меня его нет.
Ошибка в BSOD выглядит примерно так:
0x0000007B (0xFFFFF880009A9928, 0xFFFFFFFFC0000034, 0x0000000000000000, 0x0000000000000000)
и он работает под управлением Windows Server 2008 R2 Enterprise на сервере HP Proliant DL120 G6.
Я пробовал последние обновления из Windows, также пытался проверить аппаратные проблемы и конфигурацию и даже получить поддержку от людей HP, которые, по их словам, должны быть ошибкой ОС.
Некоторые люди говорят, что это ошибка драйвера фильтра (второй переключатель 0x34), и я попытался удалить все экземпляры драйвера фильтра, но безуспешно.
Есть идеи, как я могу это исправить или хотя бы устранить неполадки?
Обновление: я забыл упомянуть, что вход в безопасный режим (любой безопасный режим) также запускает BSOD, поэтому это не вариант.
Вероятно, это проблема с микропрограммой аппаратного обеспечения сервера.
Многие организации и системные администраторы не не торопитесь обновлять и поддерживать прошивку своих серверов HP ProLiant. Это требует другого мышления, чем Dell или Супермикро менее интегрированная система.
У вас есть Сервер HP ProLiant DL160 G6, так что датой развертывания является 2008–2010 годы, когда эта архитектура сервера и процессора широко использовалась. Быстрая проверка версий прошивки и примечания к выпуску показывают Обновление за сентябрь 2011 г.:
Исправленные проблемы:
Решена проблема, которая может привести к любому из следующих условий: операционная система перестает отвечать, неожиданный сброс системы, синий экран при использовании операционной системы Microsoft Windows, паника ядра при использовании операционной системы Linux или фиолетовый экран при использовании VMware ESX. При возникновении этой проблемы может отображаться сообщение операционной системы или регистрироваться в журнале событий, указывающее на «Неисправимое исключение проверки компьютера». Однако бывают случаи, когда система перезагружается до того, как операционная система отображает сообщение об ошибке, и случаи, когда журнал событий не содержит записи журнала, когда возникает эта проблема. Эта проблема не возникает, если технология Intel C-State настроена на «отключено» или для параметра ограничения пакета C State установлено значение «C1» или «C3». Система восприимчива к этой проблеме в конфигурациях настройки ограничений Intel C-State tech и C State по умолчанию.
Похоже на вашу проблему, не так ли?
Лучший подход к обновлению всей прошивки и компонентов в вашей системе (ILO, NIC, RAID, BIOS и т. Д.) это загрузить загрузочный Пакет обновления HP для образа DVD ProLiant и разрешите ему обновлять все на сервере.
Я бы посмотрел на файлы дампа и посмотрел, есть ли очевидный способ определить проблему с драйвером.
http://blogs.technet.com/b/juanand/archive/2011/03/20/analyzing-a-crash-dump-aka-bsod.aspx
Эти шаги иногда довольно быстро дают очевидный ответ. В противном случае я бы не стал тратить много времени на дальнейшее изучение этого метода, потому что он требует очень специализированных знаний. Служба поддержки Microsoft сможет продолжить расследование.