Назад | Перейти на главную страницу

Агент vSphere 6.5 HA не может быть правильно установлен или настроен

На прошлой неделе мы столкнулись со следующей проблемой: нам пришлось отключить всю нашу инфраструктуру из-за замены ИБП. По окончании электрических операций мы перезапустили:

  1. сеть
  2. SAN
  3. vCenter
  4. ESXis (2 в кластере)

Дождавшись запуска ESXi, мы обнаруживаем, что в кластере произошла ошибка: Недостаточно настроенных ресурсов для удовлетворения желаемого уровня аварийного переключения vSphere HA в кластере.

Затем мы обнаруживаем, что vCenter не может связаться с ESXis по сети: PDU коммутатора был отключен во время работы.

PDU повторно подключен, ESXis теперь может связываться с vCenter, но на каждом хосте сработал следующий сигнал тревоги: Агент vSphere HA не может быть правильно установлен или настроен.

Мы решили перезапустить оба ESX, не повезло, ошибки остались.

Из-за ограничения окна обслуживания мы решили удалить оба хоста из кластера, чтобы иметь возможность запускать наши виртуальные машины, за счет отсутствия автоматического переключения в случае отказа одного хоста.

После долгого поиска в Google, чтения большого количества KB VMware мы пробуем (без порядка):

Больше никакого результата ...

Во время нашего путешествия мы обнаруживаем только одну ошибку в /var/log/fdm.log на обоих хостах:

2018-06-25T09:05:54.232Z error fdm[47A8940] [Originator@6876 sub=Cluster] [ClusterPersistence::DoFetchDataSync] Open of file /etc/opt/vmware/fdm/kvstore failed: No such file or directory
2018-06-25T09:05:54.232Z warning fdm[47A8940] [Originator@6876 sub=Cluster] [ClusterManagerImpl::ReadPersistentObject] Couldn't open kvstore

Погугливание этого kvstore-штуки ни к чему не привело, может, мне придется пересмотреть свой гугл-фу ...

Я знаю, вы упомянули, что уже пробовали это, но на случай, если это поможет кому-то другому, я просто хотел сказать, что решение для нас было полностью отключить / удалить конфигурацию высокой доступности для всего кластера, а затем снова включить. Я также не смог найти никакой информации об этом в Google, кроме вашего сообщения.

У нас была точно такая же проблема. Только что завершил обновление до 6.5 на сервере №3 из 5. Первые два обновления прошли нормально, никаких проблем с HA. Третий прошел нормально, но HA не вернулся. Та же ошибка. То же сообщение в файле fdm.log (Ошибка открытия файла / etc / opt / vmware / fdm / kvstore: такого файла или каталога нет).

У меня были похожие проблемы, которые нельзя было решить указанными стандартными приемами.

Решением было развернуть пакет vcenter fdm и обновить его с помощью параметра force на хостах, потому что у меня были некоторые dep. проблемы с вибом.

подробности описаны здесь: https://communities.vmware.com/thread/608113