Назад | Перейти на главную страницу

узел кардиостимулятора НЕЧИСТ (не в сети)

Я слежу за http://clusterlabs.org/doc/en-US/Pacemaker/1.1-pcs/html/Clusters_from_Scratch/_verify_corosync_installation.html документ по настройке двухузлового кластера в AWS. На двух узлах установлен кардиостимулятор и включены правила FW. Когда я запускаю команду pcs status на обоих узлах, я получаю сообщение о том, что другой узел НЕЧИСТИТЬ (не в сети).

Два узла, которые я установил, - это ha1p и ha2p.

ВЫХОД НА ha1p

[root@ha1 log]# pcs status
Cluster name: mycluster
WARNING: no stonith devices and stonith-enabled is not false
Last updated: Wed Dec 24 21:30:44 2014
Last change: Wed Dec 24 21:27:44 2014
Stack: cman
Current DC: ha1p - partition with quorum
Version: 1.1.11-97629de
2 Nodes configured
0 Resources configured


Node ha2p: UNCLEAN (offline)
Online: [ ha1p ]

Full list of resources:

ВЫХОД НА ha2p

[root@ha2 log]# pcs status
Cluster name: mycluster
WARNING: no stonith devices and stonith-enabled is not false
Last updated: Wed Dec 24 21:30:44 2014
Last change: Wed Dec 24 21:27:44 2014
Stack: cman
Current DC: ha2p - partition with quorum
Version: 1.1.11-97629de
2 Nodes configured
0 Resources configured


Node ha1p: UNCLEAN (offline)
Online: [ ha2p ]

Full list of resources:

Содержание /etc/cluster/cluster.conf выглядит следующим образом:

[журнал root @ ha1] # cat /etc/cluster/cluster.conf

<cluster config_version="9" name="mycluster">
  <fence_daemon/>
  <clusternodes>
    <clusternode name="ha1p" nodeid="1">
      <fence>
        <method name="pcmk-method">
          <device name="pcmk-redirect" port="ha1p"/>
        </method>
      </fence>
    </clusternode>
    <clusternode name="ha2p" nodeid="2">
      <fence>
        <method name="pcmk-method">
          <device name="pcmk-redirect" port="ha2p"/>
        </method>
      </fence>
    </clusternode>
  </clusternodes>
  <cman expected_votes="1" two_node="1"/>
  <fencedevices>
    <fencedevice agent="fence_pcmk" name="pcmk-redirect"/>
  </fencedevices>
  <rm>
    <failoverdomains/>
    <resources/>
  </rm>
</cluster>

Любая помощь приветствуется.

pacemaker

Это происходит потому, что ваш кластер не имеет полной конфигурации stonith. В нечистом состоянии означает, что кластер не знает состояние узла.

Да, вам нужно убедиться, что имя хоста, которое вы используете в определении кластера, НЕ является именем хоста в строке 127.0.0.1 в / etc / hosts.

Так что мой /etc/hosts выглядит так:

127.0.0.1   cluster-node1 domain.com localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.0.1     node1
192.168.0.2     node2

Возможно, вы можете отредактировать файл / etc / hosts и удалить строки, содержащие 127.0.0.1 и :: 1 (строки, в которых упоминается localhost). У меня именно такая проблема, я попытался использовать этот метод и решил проблему.

Ошибка:

Node ha2p: UNCLEAN (offline)

Означает, что corosync не может связаться с другими службами corosync, на которых запущены другие узлы кластера.

Как исправить:

проверьте, какой IP прослушивает, и убедитесь, что IP находится на внешнем интерфейсе, таком как eth0, а не на интерфейсе обратной связи: ss -tulnp|egrep ':5405.*corosync'
убедитесь, что версия IP - IPv4 или IPv6, как вы ожидали. Вы можете принудительно использовать IPv4, добавив ip_version: ipv6 к totem раздел в /etc/corosync/corosync.conf файл.
проверить правила брандмауэра
проверьте другие проблемы, связанные с сетью. Убедитесь, что IP-адреса узлов доступны между собой.
использовать getent ahosts $HOSTNAME чтобы увидеть, как разрешается текущее имя хоста.