На прошлой неделе мы столкнулись со следующей проблемой: нам пришлось отключить всю нашу инфраструктуру из-за замены ИБП. По окончании электрических операций мы перезапустили:
Дождавшись запуска ESXi, мы обнаруживаем, что в кластере произошла ошибка: Недостаточно настроенных ресурсов для удовлетворения желаемого уровня аварийного переключения vSphere HA в кластере.
Затем мы обнаруживаем, что vCenter не может связаться с ESXis по сети: PDU коммутатора был отключен во время работы.
PDU повторно подключен, ESXis теперь может связываться с vCenter, но на каждом хосте сработал следующий сигнал тревоги: Агент vSphere HA не может быть правильно установлен или настроен.
Мы решили перезапустить оба ESX, не повезло, ошибки остались.
Из-за ограничения окна обслуживания мы решили удалить оба хоста из кластера, чтобы иметь возможность запускать наши виртуальные машины, за счет отсутствия автоматического переключения в случае отказа одного хоста.
После долгого поиска в Google, чтения большого количества KB VMware мы пробуем (без порядка):
Больше никакого результата ...
Во время нашего путешествия мы обнаруживаем только одну ошибку в /var/log/fdm.log
на обоих хостах:
2018-06-25T09:05:54.232Z error fdm[47A8940] [Originator@6876 sub=Cluster] [ClusterPersistence::DoFetchDataSync] Open of file /etc/opt/vmware/fdm/kvstore failed: No such file or directory
2018-06-25T09:05:54.232Z warning fdm[47A8940] [Originator@6876 sub=Cluster] [ClusterManagerImpl::ReadPersistentObject] Couldn't open kvstore
Погугливание этого kvstore-штуки ни к чему не привело, может, мне придется пересмотреть свой гугл-фу ...
Я знаю, вы упомянули, что уже пробовали это, но на случай, если это поможет кому-то другому, я просто хотел сказать, что решение для нас было полностью отключить / удалить конфигурацию высокой доступности для всего кластера, а затем снова включить. Я также не смог найти никакой информации об этом в Google, кроме вашего сообщения.
У нас была точно такая же проблема. Только что завершил обновление до 6.5 на сервере №3 из 5. Первые два обновления прошли нормально, никаких проблем с HA. Третий прошел нормально, но HA не вернулся. Та же ошибка. То же сообщение в файле fdm.log (Ошибка открытия файла / etc / opt / vmware / fdm / kvstore: такого файла или каталога нет).
У меня были похожие проблемы, которые нельзя было решить указанными стандартными приемами.
Решением было развернуть пакет vcenter fdm и обновить его с помощью параметра force на хостах, потому что у меня были некоторые dep. проблемы с вибом.
подробности описаны здесь: https://communities.vmware.com/thread/608113