Назад | Перейти на главную страницу

Тайм-аут сбоя кардиостимулятора не сбрасывает счетчик сбоев

Я использую Pacemaker 1.1.13 и Corosync 2.3.4 на Centos7.

У меня проблема с ресурсом Master / Slave. Для моего ресурса есть мета-атрибуты:

порог миграции = 1

сбой-тайм-аут = 10 с

но когда ресурс выходит из строя, есть только одна попытка его запустить. В документации указано, что атрибут Failure-Timeout = 10s должен сбрасывать счетчик сбоев каждые 10 секунд, но этого не происходит, поэтому ресурс никогда не запускается.

Вы что-нибудь знаете об этой проблеме? Может я что то не так делаю? Я отправляю свой «статус ПК» ниже:

Cluster Name: webcluster
Corosync Nodes:
 10.121.100.101 10.121.100.102
Pacemaker Nodes:
 pm-node1 pm-node2

Resources:
 Master: Services-master
  Meta Attrs: failure-timeout=10s
  Group: Services
   Meta Attrs: migration-threshold=1
   Resource: Test (class=ocf provider=scooty type=test)
    Operations: start interval=0s timeout=20 (Test-start-interval-0s)
                stop interval=0s timeout=20 (Test-stop-interval-0s)
                monitor interval=10 role=Master timeout=20 (Test-monitor-interval-10)
                monitor interval=11 role=Slave timeout=20 (Test-monitor-interval-11)

Stonith Devices:
Fencing Levels:

Location Constraints:
Ordering Constraints:
Colocation Constraints:

Resources Defaults:
 migration-threshold: 1
 failure-timeout: 10
Operations Defaults:
 No defaults set

Cluster Properties:
 cluster-infrastructure: corosync
 cluster-name: webcluster
 dc-version: 1.1.13-10.el7_2.4-44eb2dd
 have-watchdog: false
 last-lrm-refresh: 1475145002
 no-quorum-policy: ignore
 start-failure-is-fatal: false
 stonith-enabled: false

В зависимости от типа отказа, failure-timeout может быть недостаточно, чтобы его очистить. Сбои при запуске и остановке считаются «фатальными» и не устраняются автоматически с помощью тайм-аута сбоя.

Если у вас возникли проблемы с ошибкой запуска операции, вы можете установить свойство кластера start-failure-is-fatal=false. Устройства Fencing / STONITH - единственный способ восстановиться после сбоя остановки.

Надеюсь, это поможет.