Назад | Перейти на главную страницу

corosync / кардиостимулятор / ограждение - пассивный / активный кластер с 2 узлами

Я настраиваю узел 2 кластера с помощью кардиостимулятора / corosync, и у меня есть некоторые вопросы по этому поводу (и, возможно, лучшая практика: я далеко не специалист)

**OS:** redhat 7.6

I configurated the cluster with those properties

 - **stonith-enabled:** true

 - **symmetric-cluster:** true (even if is default value i think)


and added in corosync.conf

 - **wait_for_all:** 0 (i want a Node be able to start/work even if his twin is KO)

 - **two_nodes:** 1


Considering the fencing:

- Using ILO of blade HP (ILO1 for Node1, ILO2 for Node2)

I read that it was sometimes a good practice to prevent a node suicide, so added constraints 

- ILO1-fence can't locate in node1 

- ILO2-fence can't locate on node2

Проблемы у меня следующие, происходящее при запуске Node2, когда Node1 выключен:

pacemaker / corosync не может запустить ILO2-забор на узле 1 (конечно, из-за того, что узел 1 не работает), поэтому не запускайте другие ресурсы, поэтому мой кластер не работает>: [

Мне интересно, если я что-то пропускаю в своей конфигурации, или я плохо понимаю, как должен работать такой кластер.

Поскольку я ожидал, что Node2 запустится, кластер видит, что Node1 является KO, и просто запускает ресурсы, чтобы Node2 работал самостоятельно.

Но это правда, поскольку ILO2-забор может быть расположен только на Node1 (из-за ограничения, чтобы избежать самоубийства), тогда этот ресурс всегда будет терпеть неудачу ... (при попытке без этих ограничений "анти-самоубийства", если у Node2 есть сбой некоторых сервисов , затем он отключается сразу после запуска, чего я не хочу)

Буду признателен за некоторые возвраты и просветления :)

Спасибо :)

У вас, скажем, 4 голоса в вашем кластере - 2 узла и 2 МОТ-забора. Кластер может работать, если доступно> 2 (3). ILO2 настроен только с node1, поэтому, если node1 не работает - qourum теряется. Использование МОТ-фехтования не рекомендуется:

«Распространенной ошибкой, которую делают люди при выборе устройства STONITH, является использование удаленного переключателя питания (например, многих бортовых контроллеров IPMI), который разделяет питание с узлом, которым он управляет. Если в этом случае произойдет сбой питания, кластер не может быть убедитесь, что узел действительно отключен или активен и страдает от сбоя сети, чтобы кластер остановил все ресурсы, чтобы избежать возможной ситуации разделения мозга ". ссылка на сайт

У вас есть 2 варианта для двухузлового кластера:

1) Используйте одно внешнее устройство ограждения (узел-свидетель, общий файловый ресурс VSA или SMB2 / 3).

2) Используйте решение, разработанное для 2-узловых кластеров (например, Hyper-V / VMware + Datacore или StarWind).