Назад | Перейти на главную страницу

настроить Heartbeat на Centos Linux - сообщение об ошибке

Я установил Heartbeat на свой Centos Linux, и он, кажется, частично работает ... но я безуспешно пытаюсь контролировать службу. только когда я перезагружаю основной сервер, резервный сервер берет на себя. в логах получаю:

heartbeat[30476]: 2012/03/20_18:51:57 WARN: string2msg_ll: node [node1] failed authentication
heartbeat[30476]: 2012/03/20_18:51:58 WARN: string2msg_ll: node [node02] failed authentication

ключи авторизации идентичны (скопированы из одного в другой). это мой ha.cf:

logfile /var/log/ha-log
logfacility local0
keepalive 2
deadtime 30
initdead 120
bcast eth0
udpport 694
auto_failback on
node server01.com 
node server02.com

источники:

server01.com 38.108.117.3 aim chat

любая идея, как решить проблему, поэтому, если служба останавливает другой сервер, возьмет на себя управление Спасибо! Э.

Вы используете синтаксис Heartbeat v1. Если вы используете это, здесь не будет мониторинга (по умолчанию). Если вам также нужен мониторинг, вам придется преобразовать его в синтаксис v2 (XML) и добавить методы мониторинга.

Еще несколько замечаний о вашей конфигурации:

  • Автоматическое восстановление после сбоя никогда не бывает хорошей идеей. Вы можете создать красивый "пинг-понг" с этим
  • Вещание - не лучшая идея с двумя узлами. Вместо этого используйте ucast.
  • Всего одно сетевое соединение? Развлекайтесь с множеством раздвоенных мозгов.

Теперь вернемся к вашему первоначальному вопросу: похоже, что другие узлы (из разных кластеров?) Пытаются общаться по одному и тому же широковещательному IP и одному и тому же UDP-порту.

«Ваши» узлы - это «server01.com» и «server02.com» - вы видите два других узла («node1» и «node02»).

  • Используйте разные UDP-порты для каждого кластера
  • Используйте одноадресную рассылку вместо широковещательной рассылки (см. Выше).

Обновление: Как настроить одноадресную рассылку:

RTFM (прочтите хорошо руководство) из rpm -qd|grep "ha.cf":

#       Set up a unicast / udp heartbeat medium
#       ucast [dev] [peer-ip-addr]
#
#       [dev]           device to send/rcv heartbeats on
#       [peer-ip-addr]  IP address of peer to send packets to
#
#ucast eth0 192.168.1.2

Для мониторинга и аварийного переключения сервисов (а не только боксов) вам понадобится полная настройка Pacemaker / Corosync / Heartbeat, а не просто базовая Heartbeat. Если вы используете haresources, вы используете базовый Heartbeat.

Установку от EPEL можно найти здесь:

http://www.clusterlabs.org/wiki/Install#Installing_on_EPEL-5_Compatible_Distributions:_RHEL.2C_CentOS.2C_etc

В вики ClusterLabs будет другая документация по настройке Pacemaker для конкретных сервисов.