У меня 2 сервера в отказоустойчивый кластер. Кластер определяет общий диск ClusterStorage. Диск сопоставляется с устройством SAN через iScsi.
Недавно два сервера перезагружались одновременно. Ошибки в журнале событий сервера и кластера указывают на то, что серверы не могут получить доступ / записать на общий диск. Каждый сервер имеет доступ к SAN через 2 отдельных сетевых пути в 2 разных подсетях с использованием 2 сетевых карт. SAN имеет 2 контроллера. Журнал событий в SAN не сообщает об ошибках, связанных с этим событием. Кроме того, сервер базы данных, который также использует SAN (через роль SQL, определенную в кластере и на выделенном диске), не сообщал об ошибках ввода-вывода.
Похоже, это указывает на то, что сеть SAN в порядке и доступна. Тем не менее, два сервера перезагружались сами по себе, что лишило смысла резервирование через кластер.
События кластера - MAPLE перезагружен
Журнал административных событий на MAPLE
Система даже войти в MAPLE
Есть идеи по поводу настоящей причины перезагрузки?