Я установил Heartbeat на свой Centos Linux, и он, кажется, частично работает ... но я безуспешно пытаюсь контролировать службу. только когда я перезагружаю основной сервер, резервный сервер берет на себя. в логах получаю:
heartbeat[30476]: 2012/03/20_18:51:57 WARN: string2msg_ll: node [node1] failed authentication
heartbeat[30476]: 2012/03/20_18:51:58 WARN: string2msg_ll: node [node02] failed authentication
ключи авторизации идентичны (скопированы из одного в другой). это мой ha.cf:
logfile /var/log/ha-log
logfacility local0
keepalive 2
deadtime 30
initdead 120
bcast eth0
udpport 694
auto_failback on
node server01.com
node server02.com
источники:
server01.com 38.108.117.3 aim chat
любая идея, как решить проблему, поэтому, если служба останавливает другой сервер, возьмет на себя управление Спасибо! Э.
Вы используете синтаксис Heartbeat v1. Если вы используете это, здесь не будет мониторинга (по умолчанию). Если вам также нужен мониторинг, вам придется преобразовать его в синтаксис v2 (XML) и добавить методы мониторинга.
Еще несколько замечаний о вашей конфигурации:
Теперь вернемся к вашему первоначальному вопросу: похоже, что другие узлы (из разных кластеров?) Пытаются общаться по одному и тому же широковещательному IP и одному и тому же UDP-порту.
«Ваши» узлы - это «server01.com» и «server02.com» - вы видите два других узла («node1» и «node02»).
Обновление: Как настроить одноадресную рассылку:
RTFM (прочтите хорошо руководство) из rpm -qd|grep "ha.cf"
:
# Set up a unicast / udp heartbeat medium
# ucast [dev] [peer-ip-addr]
#
# [dev] device to send/rcv heartbeats on
# [peer-ip-addr] IP address of peer to send packets to
#
#ucast eth0 192.168.1.2
Для мониторинга и аварийного переключения сервисов (а не только боксов) вам понадобится полная настройка Pacemaker / Corosync / Heartbeat, а не просто базовая Heartbeat. Если вы используете haresources, вы используете базовый Heartbeat.
Установку от EPEL можно найти здесь:
В вики ClusterLabs будет другая документация по настройке Pacemaker для конкретных сервисов.