У меня возникла проблема с одним из моих серверов - DELL PowerEdge 2850. Он неожиданно перезагружается, записывая идентификатор события 6008 в журнал событий («Неожиданное завершение работы»). Проблема началась вчера, вчера она перезагружалась около 10 раз и продолжалась до сегодняшнего дня.
В журнале событий непосредственно перед событием 6008 нет других событий или ошибок. С оборудованием мы ничего не меняли. Единственное, что мы изменили «программно», это то, что мы включили разработанную нами службу .NET, работающую на том же сервере, который работал без каких-либо проблем в течение 2 лет. В остальном программное обеспечение осталось прежним. У меня он настроен на дамп памяти ядра всякий раз, когда происходит сбой сервера, но он даже этого не делает. Я позвонил в техподдержку, но решения пока нет. Я переустановил блоки питания, переключил PDU, в который включены блоки питания сервера, и я провел полные диагностические тесты DELL (а не быстрые тесты), и все прошло успешно. Я предложил техподдержке, может быть, это блоки питания, но сказал нет, потому что у него два блока питания, а один действует как резервный, так что этого не может быть.
Другие примечания, серверы не включены в USP - что не идеально, но это настройка. У меня есть два других сервера в комнате, которые работают рядом с ним, и ни один из них не испытывает тех же проблем, что и этот сервер.
Кто-нибудь испытывал подобные проблемы? Приветствуются любые идеи или предложения!
Спасибо!
Отмените последнее, что вы сделали (включили службу .NET), независимо от того, как она работала в прошлом или как она работает на другом сервере.
Это может быть целая куча вещей, вызывающих его перезагрузку. Поскольку вы сказали, что включили дамп ядра и не получаете его, это может означать, что либо питание немедленно отключается из системы и не дает ему шанса, либо ядро считает небезопасным записывать дамп на диск. В любом случае, это похоже на оборудование, связанное со мной.
Возможно, вы захотите выключить его и переустановить ОЗУ, а если жесткие диски поддерживают горячую замену, просто слегка подтолкните их. Хватаются за соломинку, но мало ли.
Просматривая журнал событий, какие события произошли перед выключением - что-то необычное или странно постоянное непосредственно перед выключением? В Система log, вероятно, будет наиболее полезным, но заявка log иногда может отображать интересные вещи.
Я не знаком с серверами Dell, но если они чем-то похожи на серверы HP, у них будет какой-то iLO, который может дать вам некоторое указание на аппаратную неисправность. У меня было что-то похожее - Windows сообщила о неожиданном завершении работы, но интегрированные журналы HP сообщили, что жесткий диск вышел из строя непосредственно перед перезагрузкой, и я могу только предположить, что RAID-контроллер выбросил воблер, который Windows не удовлетворил и разбился.