Я настраиваю узел 2 кластера с помощью кардиостимулятора / corosync, и у меня есть некоторые вопросы по этому поводу (и, возможно, лучшая практика: я далеко не специалист)
**OS:** redhat 7.6
I configurated the cluster with those properties
- **stonith-enabled:** true
- **symmetric-cluster:** true (even if is default value i think)
and added in corosync.conf
- **wait_for_all:** 0 (i want a Node be able to start/work even if his twin is KO)
- **two_nodes:** 1
Considering the fencing:
- Using ILO of blade HP (ILO1 for Node1, ILO2 for Node2)
I read that it was sometimes a good practice to prevent a node suicide, so added constraints
- ILO1-fence can't locate in node1
- ILO2-fence can't locate on node2
Проблемы у меня следующие, происходящее при запуске Node2, когда Node1 выключен:
Мне интересно, если я что-то пропускаю в своей конфигурации, или я плохо понимаю, как должен работать такой кластер.
Поскольку я ожидал, что Node2 запустится, кластер видит, что Node1 является KO, и просто запускает ресурсы, чтобы Node2 работал самостоятельно.
Но это правда, поскольку ILO2-забор может быть расположен только на Node1 (из-за ограничения, чтобы избежать самоубийства), тогда этот ресурс всегда будет терпеть неудачу ... (при попытке без этих ограничений "анти-самоубийства", если у Node2 есть сбой некоторых сервисов , затем он отключается сразу после запуска, чего я не хочу)
Буду признателен за некоторые возвраты и просветления :)
Спасибо :)
У вас, скажем, 4 голоса в вашем кластере - 2 узла и 2 МОТ-забора. Кластер может работать, если доступно> 2 (3). ILO2 настроен только с node1, поэтому, если node1 не работает - qourum теряется. Использование МОТ-фехтования не рекомендуется:
«Распространенной ошибкой, которую делают люди при выборе устройства STONITH, является использование удаленного переключателя питания (например, многих бортовых контроллеров IPMI), который разделяет питание с узлом, которым он управляет. Если в этом случае произойдет сбой питания, кластер не может быть убедитесь, что узел действительно отключен или активен и страдает от сбоя сети, чтобы кластер остановил все ресурсы, чтобы избежать возможной ситуации разделения мозга ". ссылка на сайт
У вас есть 2 варианта для двухузлового кластера:
1) Используйте одно внешнее устройство ограждения (узел-свидетель, общий файловый ресурс VSA или SMB2 / 3).
2) Используйте решение, разработанное для 2-узловых кластеров (например, Hyper-V / VMware + Datacore или StarWind).