Назад | Перейти на главную страницу

Esxi 5.1 Core Dump с последующей низкой производительностью на ВМ Server 2012; ОК после отключения внешних хранилищ данных iSCSI

У меня есть Dell R510 под управлением esxi 5.1 с 16 ГБ оперативной памяти; 1 процессор (Xeon L5520 @ 2,27 Гц; 4 ядра), на котором работает одна машина Server 2012. Я пришел сегодня утром к этому

дамп ядра. Зажал кнопку включения и перезагрузился. Он вернулся к экрану «Восстановление VMWARE», и через 10-20 минут я вернулся, и он вернулся к своему обычному экрану (информация о Vmware; информация об управлении IP-адресами и т. Д.), И единственный сервер на машине загрузился сам. резервное копирование. Проблема в том, что с тех пор это кажется невероятно вялым. Сервер кажется нормальным; монитор производительности никогда не был доведен до максимума. Похоже, что наиболее часто используемым является сеть; У меня используется только одна сетевая карта (у нас есть около 10 пользователей общего доступа к файлам данных на сервере, и на нем работают службы DNS, AD и DHCP). Я заменил переключатель между перерывами, думая, что, возможно, виноват, но все равно получаю те же результаты. Время от времени мой сеанс RDP с сервером будет потерян, но в конечном итоге восстановится.

Есть идеи, где искать виновника замедления? Есть идеи, что я могу попробовать повысить производительность? Достаточно ли одной сетевой карты для обмена файлами 10 пользователей (в основном мы используем файлы Quicken и офисные xls / word), ничего особенного.

Однажды я попытался добавить еще одну сетевую карту и "объединить их в команду", но это сломало все, и мне было трудно вернуться, чтобы что-то изменить, так как "объединенный" ник решил использовать dhcp, и я не мог добраться до сервера DHCP, чтобы найти адрес (поскольку сервер является dhcp-сервером).

Спасибо за любые идеи.

ОБНОВИТЬ

С тех пор я отключил сервер от сети и переместил его в другое место. Поскольку он был отключен от сети, он работал нормально (н.б. был еще один дамп ядра, такой же, как на рис., Прежде чем я отключил сеть). Может ли это быть результатом внешнего сопоставленного хранилища данных iSCSI? У меня было 2 на хосте, и в журнале vmkernel были ошибки о том, что он не может войти в систему, но по крайней мере некоторые из ошибок были известны ОК:https://kb.vmware.com/s/article/1031221 но не уверен насчет других. Вот несколько снимков ошибок vmkernel: https://imgur.com/a/DOA3umn

Кроме того, вот пастебин последней версии vmkernel.log. У меня также есть файлы syslog, usb, vmkeventd, vmksummary, vmkwarning, vprobed и vpxa.log, которые я могу загрузить. https://pastebin.com/rmp3k1G5

Обновление 2

Я оставил машину работать на выходных, и на данный момент она все еще работает нормально. Ни паники, ни крушения. Хотите знать, могут ли внешние устройства NAS, отображаемые как хранилища данных через iSCSI, быть причиной cuplrit? Особенно беспокоит то, что они есть у меня и на паре других хостов ...

Трассировка стека заканчивается мегапикселями, что означает, что команда вашего MegaRAID (у вас, вероятно, есть какой-то RAID-массив), возможно, неожиданно завершилась ошибкой или это ошибка драйвера. Я бы рекомендовал обновлять прошивку MegaRAID вместе с драйвером ESXi (и, возможно, самим ESXi, пока вы на нем). ESXi 5.1 - это древний продукт, но вы все еще можете получать обновления и асинхронные драйверы с сайта VMware.

Мое чутье подсказывает, что с хранилищем что-то не так - это также может объяснить медлительность, вызванную очень высокой задержкой диска (вы должны увидеть это в PerfMon, Resource Monitor или vSphere Client мониторинг). Проверьте состояние RAID и диска в megacli / storcli или перезагрузитесь в WebBIOS, чтобы проверить состояние массива и диска.

Моим первым предположением было бы «хранилище».

Как настраиваются диски и тома? Какой тип RAID используется?

Я почти уверен, что у вас восстановленный или поврежденный дисковый массив; это объяснило бы медлительность.