У меня есть кластер Server 2008R2 Hyper-V с 2 узлами. Они используют CSV в сети SAN. Я использую SCVMM для управления ими. Недавно у нас было несколько сбоев, которые привели к аварийному переключению, из-за чего виртуальные машины умирали и запускались на другом узле. По большей части это работало нормально. В какой-то момент во время сбоя питания оба узла не могли получить доступ к SAN на мгновение, и CSV отключился. Перевод его в оперативный режим в диспетчере отказоустойчивого кластера сработал, и большинство виртуальных машин запустились нормально.
Однако одна виртуальная машина не запускается.
Помимо указанной выше ошибки, похоже, нет недавних соответствующих журналов в отказоустойчивом кластере или журналов событий Windows на любом узле. В разделе «Критические события» я вижу несколько сбоев в диспетчере отказоустойчивого кластера, произошедшие на прошлой неделе:
Я просмотрел файлы в SAN. Все они кажутся целыми. Файл конфигурации XML кажется действительным (некоторые исследования показали, что это могло произойти, если файл XML был поврежден).
Изменить: я также запустил отчет о проверке кластера. Помимо сбойного ресурса и некоторых ожидаемых ошибок, что он не может протестировать диски, пока они находятся в сети, все выглядит нормально.
Как мне снова запустить эту виртуальную машину?
Несмотря на то, что точно неизвестно, что вызвало проблему, снова запустить виртуальную машину было довольно просто:
Когда я остановил службу кластера, виртуальная машина была немедленно передана одному из оставшихся узлов и запустилась автоматически.