Назад | Перейти на главную страницу

Определение причины перезагрузки сервера

у меня есть HP ProLiant DL380p Gen8 это работает VMWare ESXi 5.5. Он перезагружался с кажущимися случайными интервалами в течение последних 24 часов. Работает только одна виртуальная машина, и даже если я выключу ее, хост все равно перезагрузится. Серверу не хватает памяти или места на диске, и, насколько я могу судить, он не перегревается. Я пробовал просматривать файлы журналов, но есть на что посмотреть.

Каковы наиболее важные шаги при диагностике этой проблемы (в том числе, какие настройки проверять, какие файлы смотреть, какое конкретное сообщение указывает на проблему, должен ли я начинать извлекать память, есть ли диагностический компакт-диск, который все это делает за меня и т. Д.) ?

Я знаю, что это очень широкий вопрос. Я буду рад предоставить файлы журналов, если необходимо, чтобы это было более конкретно для моей ситуации.

Вот несколько предложений.

  • Ваш МОТ подключен и настроен? Он расскажет вам, что именно происходит с системой. Пожалуйста, просмотрите журнал ILO4.

  • Просмотр журнала IML системы (доступен на вкладке «Оборудование» ILO или vSphere)

  • Есть ли на экране какие-либо индикаторы или сообщения об ошибках во время сбоя или во время POST?

  • Используете ли вы установку ESXi для HP (включая дополнительные драйверы и инструменты)?

  • Какую версию и номер сборки ESXi вы используете?

  • Если виртуальная машина, которую вы используете, является гостевой Windows 2012 или 2008, возможно, вы столкнулись с ошибкой драйвера сетевой карты.

  • Проверьте свои силовые соединения. У вас есть двойные блоки питания? Поочередно переставляйте силовые кабели.

  • Посмотрите на массив светодиодных индикаторов System Insight на передней панели сервера, чтобы определить, есть ли внутренняя проблема с работоспособностью.