Назад | Перейти на главную страницу

Одновременный сбой сервера в отказоустойчивом кластере

У меня 2 сервера в отказоустойчивый кластер. Кластер определяет общий диск ClusterStorage. Диск сопоставляется с устройством SAN через iScsi.

Недавно два сервера перезагружались одновременно. Ошибки в журнале событий сервера и кластера указывают на то, что серверы не могут получить доступ / записать на общий диск. Каждый сервер имеет доступ к SAN через 2 отдельных сетевых пути в 2 разных подсетях с использованием 2 сетевых карт. SAN имеет 2 контроллера. Журнал событий в SAN не сообщает об ошибках, связанных с этим событием. Кроме того, сервер базы данных, который также использует SAN (через роль SQL, определенную в кластере и на выделенном диске), не сообщал об ошибках ввода-вывода.

Похоже, это указывает на то, что сеть SAN в порядке и доступна. Тем не менее, два сервера перезагружались сами по себе, что лишило смысла резервирование через кластер.

События кластера - MAPLE перезагружен

Журнал административных событий на MAPLE

Система даже войти в MAPLE

Есть идеи по поводу настоящей причины перезагрузки?