Я уже час ждал поддержки VMware, и держу пари, что serverfault может дать им ответ!
Я запускаю ESX 4.0 и 4.1 на 6 блейд-серверах HP, используя хранилище LUN FibreChannel. На выходных мы провели некоторое техническое обслуживание сети FC и отключили 2 из 4 путей, которые хосты ESX имеют к массиву хранения (EMC Clariion). Когда это произошло, все 6 хостов ESX отключили все свои виртуальные машины.
Я видел такие сообщения в событиях:
Path redundancy to storage device naa.600.... degraded. Path vmhba0:.... down. 2 remaining active paths Affected datastores: ....
это было ожидаемо. затем через 3 минуты:
Guest OS shutdown for vm1
(это сделал vpxuser)
vm1 is powered off
(пользователь «Пользователь»)
зачем ему это делать, если еще есть хорошие пути? Я нигде не вижу такой настройки. Спасибо!
Как мы выяснили в комментариях, это казалось и на самом деле было ответом изоляции высокой доступности.
Чтобы дать ответу немного больше значения: чтобы избежать таких неудач, я рекомендую настроить другой сетевой путь для HA, настроив сервисную консоль (ESX) / порт управления (ESXi), который будет использовать путь, полностью отдельный от вашего основного сетевого стека. (vSwitch, pNIC, физический коммутатор, ИБП, силовая цепь).