Назад | Перейти на главную страницу

ESXi 4.0 Гости блокируются

Я установил ESXi 4.0 на HP Proliant g5 с 64-битным процессором Xeon и воспользовался бесплатной лицензией, поскольку работаю в государственной школе. Я создал два экземпляра server 2003 с нуля: один для DC, DHCP, другой для файлового сервера и резервного копирования DNS / DHCP. У меня были оба гостя, которые работали нормально, настраивали учетные записи пользователей, передавали данные и т. Д.

Как только я присоединил клиентский компьютер к домену, я обнаружил, что оба моих гостя Windows зависают. Иногда это длилось пять минут или около того, а иногда и на ночь. Состояние «заблокировано» означает, что, насколько я могу судить, все службы были остановлены; dhcp больше не выдавал IP-адреса, DNS перестал работать, я не мог подключиться к серверу по RDP. Хост ESXi, мой сервер HP, все еще работал нормально. VSphere работал, и я мог наблюдать за выступлениями отдельных гостей.

Я бы попробовал выключить хосты изнутри VSPhere, и хосты начали бы выключаться, но зависали на 95% и оставались так, иногда только на 10 минут, другие на часы. Несколько раз мне приходилось перезапускать ESXi с его консоли, чтобы перезапустить мои машины.

Теперь, может ли кто-нибудь сказать мне, что происходит, и как я могу это исправить или предпринять шаги, чтобы предотвратить это? Я нанял консультанта, чтобы взглянуть на него, человека, которому я доверяю, и он сказал мне, что никогда раньше не видел ничего подобного. Он поговорил со своим другом, имеющим сертификат VM, и также сказал, что никогда не слышал об этой проблеме. Спасибо за ответы, и я постараюсь ответить как можно скорее. В настоящее время сервер отключен, я восстановил свои серверы Server 2000 девятилетней давности и подумываю об установке ESXi 3.5. Кто-нибудь знает, что хост, созданный в 4.0, будет работать в 3.5? Мне бы очень хотелось избежать восстановления этих учетных записей! Я знаю, что 4.0 работает на этом сервере, так как у меня есть другой сервер в другой школе с таким же аппаратным обеспечением, на котором отлично работает 4.0.

Мне это кажется аппаратной проблемой, например, плохой барабан. Попробуйте запустить диск автономной диагностики для вашей модели сервера (если у вас его нет, вы можете загрузить ISO-образ с сайта hp.com)

Журналы что-нибудь показывают? А что насчет сетевой активности виртуальных машин из VSphere?

Следующее, что я попробую сделать, это установить какой-то анализатор пакетов, если в журналах ничего не отображается. Если система на все отзывчивый, вы можете попробовать запустить wirehark прямо в системе, которая не работает, посмотрите, обновит ли он экран перед замедлением или блокировкой. Возможно, запуск tcpmon из sysinternals может дать ключ к разгадке.

В противном случае попробуйте настроить виртуальную машину с Linux и направить ее (или перенаправить сетевой трафик с виртуальных машин) через нее, чтобы увидеть, что она может видеть с помощью wirehark.

Если сетевой трафик становится сумасшедшим, возможно, вам придется найти способ уловить, что происходит; если бы это был просто конфликт имен или какая-то проблема репликации AD, это было бы в журналах.

Мы видим деградацию, когда в сети происходят тяжелые процессы резервного копирования, но вы ничего не упомянули о репликации файлов или о чем-то подобном.

Возможно ли это в вашей ситуации?

Когда это произойдет, посмотрите, можете ли вы войти в консоль на хосте (не уверен, дает ли вам ESXi консоль или нет) и посмотрите, осиротел ли процесс или нет. Если процесс, которым является виртуальная машина, осиротел, вам придется перезагрузить хост, чтобы очистить процесс.

Я видел, как это происходило пару раз на ESX 3.5 и 4.0. Если гости обновляются с версии 3.5, вам необходимо убедиться, что была обновлена ​​версия оборудования, а также клиентские инструменты. Я предполагаю, что вы установили клиентские инструменты на гостей?

У меня нет причин подозревать, что есть проблема совместимости, но проверяли ли вы сами серверы и все компонентное оборудование (особенно сетевые адаптеры, в свое время видели множество проблем с сетевыми адаптерами) на совместимость с ESXi 4 VMware HCL?

Это двухъядерный процессор? Как вы настраивали свои виртуальные машины, какое количество виртуальных ЦП вы выбирали для каждой? Я точно знаю, что у 3.5 есть проблемы со временем загрузки, если вы выбрали более 1 виртуального ЦП на каждой машине, и вы все равно не получили от него никакой производительности.

В прошлом я сталкивался с ситуациями, когда что-то в групповой политике приводило к тому, что машина периодически блокировалась (в моем случае он применял специальные GPO для Vista для управления питанием на машине Win 7 IIRC), поэтому я бы посоветовал быстро взглянуть чтобы увидеть, вызвало ли присоединение к домену небольшую проблему.

Проверьте следующее:

  • Какие-нибудь моментальные снимки в настоящее время остаются открытыми на гостевой виртуальной машине? Моментальные снимки на контроллерах домена - не лучшая идея, но, как правило, если оставить снимок открытым на долгое время, это может привести к зависанию виртуальных машин, особенно на серверах SQL и Exchange контроллеров домена.

  • Любое необычное оборудование, подключенное к виртуальной машине, например Дискета, сквозной USB-порт или последовательные порты? Сократите количество устройств до необходимого вам минимума.

  • Выполните набор тестов на оборудовании сервера. В smartstart HP для G5 есть приличный набор. Если у вас все еще есть поддержка по оборудованию, позвоните в HP и узнайте, есть ли у их службы поддержки какие-либо советы (они довольно хороши, IMO).

  • Замените флэшки RAM другим набором, если они у вас есть.

С каких дисков запускаются виртуальные машины? SAN или местный? Штатный контроллер, или дискретный? Вы исключили проблемы с установочным носителем?

Изменить: только что вспомнил ... проверьте настройки сетевой карты на хост-сервере. Я смутно помню, что у меня были проблемы с включением одной из функций сетевого адаптера (разгрузка TCP?) На сетевом адаптере хоста и необходимость его отключения в ESX 4.0.

У меня есть проблема, связанная с вышеизложенным (ESXi 4), но это произошло только с третьими виртуальными машинами, которые зависают и не могут выключиться, но застряли на 95%. Заметил, что проблема связана с SEP10, но 1-я и 2-я виртуальные машины, установленные с Symantec, не имеют проблемы, кроме 3-й. Удалите виртуальную машину заново, и она останется прежней и всегда будет третьей виртуальной машиной.