В эти выходные мы планируем обновить IOS на коммутаторе Cisco. К этому коммутатору подключены три наших сервера ESX и iSCSI SAN, которую использует сервер ESX.
В прошлом, когда мы считали необходимым перезагрузить коммутатор, все работающие виртуальные машины отключались, а затем перезагружались хостами ESX. Я пытаюсь избежать этого, поскольку это не изящное завершение работы.
Можно ли изменить конфигурацию VirtualCenter, чтобы этого не произошло? Или какие-либо другие идеи относительно того, почему это могло произойти, если это не связано с VirtualCenter?
Похоже, у вас хитрая установка VMware HA. Имейте в виду, что если вся ваша сеть ESX подключена к одному коммутатору, то у вас есть сеть, которую нужно немного изменить.
Если у вас есть кластер ESX (особенно с включенной HA), то каждый хост должен иметь два отдельных порта сервисной консоли, подключенных к двум отдельным физическим сетевым адаптерам, которые подключены к двум отдельным коммутаторам, чтобы вы никогда не потеряли доступ к управлению хостами, если потеряете один выключатель (или выньте его для обслуживания). Если узлы ESX настроены в кластере высокой доступности и теряют связь друг с другом с интерфейсами Service Console более чем на 15 секунд, HA попытается перезапустить защищенные виртуальные машины и (по умолчанию) выключит работающий экземпляр виртуальной машины.
Я знаю, что этот ответ приходит через некоторое время после вопросов, но недавно я столкнулся с этой проблемой и нашел совершенно другое решение для перезагрузки виртуальной машины.
Если у вас есть кластер VMware HA, то в VirtualCenter щелкните правой кнопкой мыши кластер и выберите Изменить настройки.
В диалоговом окне «Параметры кластера» выберите слева VMware HA. На правой панели вы увидите раздел под названием Настройки кластера по умолчанию Установить Ответ об изоляции хоста раскрывающийся список "Оставить ВМ включенной"
Таким образом, когда сетевое соединение восстановится, хосты останутся на месте и смогут продолжать выполнять свою работу.
Существует тайм-аут для вашего хранилища, спрятанного где-то в гостевой ОС. когда Windows не может получить доступ к диску более x секунд, происходит сбой.
HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\Disk
Name TimeOutValue
Typ REG_DWORD
Value 60 (dezimal) for 60 Seconds
Извините, если я здесь тупой, но вы говорите, что храните свои виртуальные машины в iSCSI-боксе, и каждый хост подключен только к одному коммутатору?
Если это так, то отключение этого коммутатора на 100% приведет к уничтожению каждой виртуальной машины, хранящейся в блоке iSCSI SAN, поскольку каждый хост потеряет не только свою сеть, но и свое постоянное хранилище в блоке iSCSI SAN.
Единственный способ пережить такого рода изменения, отказавшись от избыточности, - это подключить Storage vMotion каждой виртуальной машины к локальному хранилищу каждого хоста на время отключения коммутатора, а затем вернуться в SAN, когда коммутатор будет резервным.
Если это не ваша ситуация, не могли бы вы добавить дополнительные сведения, чтобы прояснить ситуацию.