Можно ли предотвратить блокировку узла pc / dlm / crm в случае его сбоя?
Я использую кластер только для того, чтобы создать хранилище GFS2, и есть свой способ избежать разделения мозга. Так что мне не нужны такие вещи, как забор и dlm-замки.
Я попытался настроить работу при отказе в CentOS7 следующими способами: использовать pcs resource update dlm/clvmd/gfs2_res op monitor onfail=ignore
и отредактируйте файл /etc/corosync/dlm_cfg
, отредактируйте on-fail="ignore"
и перезагрузите все узлы. После перезагрузки могу проверить с pcs cluster cib
, весь «забор» стал «игнорировать»
Но когда я убиваю corosync в одном узле, другой все равно пытается его заблокировать, как видно из журнала сообщений. 5 марта 10:37:10 node0 stonith-ng [1733]: notice: remote_op_done: Операция перезагрузки node3 с помощью node3 для stonith_admin.controld.24862@node3.a7be5018: такого устройства нет
5 марта 10:37:10 node0 crmd [1739]: notice: tengine_stonith_notify: Одноранговый узел node3 не был завершен (перезагружен) узлом node3 для node3: такого устройства (ref = a7be5018-4894-4de2-9273-8867d034d7af) клиентом stonith_admin не было. controld.24862
Мне просто интересно, есть ли способ полностью обойти забор? Это просто приносит много проблем в мою систему.