У нас есть отказоустойчивый кластер Microsoft с динамическими дисками, которым управляет Veritas Storage Foundation. Сегодня системные администраторы добавили новый диск для SQL Server, но размер кластера на томе был неправильным, поэтому я выпустил быстрое форматирование, чтобы изменить его.
Произошел сбой дискового тома, также произошел сбой группы SQL Server, и кластер перестал отвечать. Через несколько минут мне удалось переключиться на пассивный узел.
Администраторы SAN говорят, что это моя вина, потому что мне не следовало форматировать диск с помощью апплета формата Windows, но вместо этого мне следовало использовать Veritas Enterprise Administrator.
Может ли операция форматирования таким образом отключить всю группу кластера?
Соответствующие сообщения об ошибках:
Из журнала событий:
The cluster resource host subsystem (RHS) stopped unexpectedly.
An attempt will be made to restart it. This is usually due to a
problem in a resource DLL. Please determine which resource DLL is
causing the issue and report the problem to the resource vendor.
Из cluster.log
ERR [RCM] rcm::RcmResControl::DoResourceControl:
ERROR_RESOURCE_CALL_TIMED_OUT(5910)' because of 'Control(STORAGE_GET_DISK_INFO_EX)
to resource 'NameOfTheDiskGroup' timed out.'
Документация Veritas:
Отрывок из Документация Symantec:
Примечание. Перед созданием ресурса вручную необходимо отформатировать общий том кластера с NTFS с помощью графического интерфейса пользователя VEA и смонтировать его на узле, на котором вы пытаетесь создать ресурс.
Означает ли это, что диск нельзя форматировать в Windows? Я так не читаю.
Для записи, в прошлом я форматировал множество дисков с помощью апплета Windows, и ничего плохого не произошло.
Учитывая, что это общий том, похоже, что кластерные узлы уже пытались его использовать, поэтому использование графического интерфейса VEA было бы лучшим способом. Это не упоминается в их документации, но они, скорее всего, делают что-то отличное от графического интерфейса Windows (даже если это просто временная блокировка записи в CSV с машины, на которой запущена VEA, чтобы он действительно мог форматировать том, сообщая узлы для использования другого диска и т. д.
Кроме того, я подозреваю, что более серьезная проблема заключалась в следующем:
Примечание: Вы должны убедиться, что выбранная буква диска для нового общего тома кластера доступна и не используется ни на одном из узлов кластера.
Похоже, что ваш диск использовался, когда вы его форматировали. Форматирование диска в NTFS с помощью Windows, вероятно, тривиально, но тот факт, что диск использовался и вы не использовали графический интерфейс VEA, который, возможно, мог бы предотвратить некоторые проблемы.
Да. Если диск уже был настроен как зависимость от SQL Server (и для использования диск должен быть зависимостью от ресурса SQL Server), то, кстати, как работает WSFC, вы могли вызвать «сбой», так сказать, вызывающий дисковый ресурс будет отключен, что приведет к отключению всей роли. Возможно, это не так, но это кластерная перспектива. Я никогда не форматировал диск постфактум и не видел, что он делает.
Также может быть, что Symantec / Veritas НЕ является NTFS, поэтому при настройке вы все испортили, и дисковый ресурс отключился при форматировании. Опять же, если он настроен как зависимость от ресурсов SQL Server, это приведет к эскалации.