Я тестирую инструмент RedHat Cluster Administration, описанный здесь: https://access.redhat.com/site/documentation/en-US/Red_Hat_Enterprise_Linux/6/html/Cluster_Administration/index.html
У меня две виртуальные машины под управлением CentOS 6.4. Я тестировал сценарии аварийного переключения; перезапуск первичного компьютера и корректное выключение первичного компьютера успешно переносят ресурсы на вторичный компьютер (такие как DRBD, Tomcat, MySQL, Apache).
Однако я хотел смоделировать полный сбой питания или принудительное отключение. В клиенте XenCenter я принудительно выключаю первичный компьютер и смотрю журналы на вторичном. Короче говоря, кажется, что ресурсы НИКОГДА не переносятся на вторичный, а интерфейс управления кластером, кажется, думает, что службы все еще работают на первичном.
Вот вывод из журналов вторичного компьютера: http://pastebin.com/gsi6uBct
В основном жалуется на фехтование. Но я не понимаю: если первичный узел полностью умирает сам по себе, городить нечего.
Идеи?
Фехтование должно происходить вне группы. Если вы теряете сеть между двумя хостами, нет среды для проверки работоспособности, так должен ли вторичный хост пытаться запускать службы? Нет, поскольку это приведет к повреждению данных, эти службы все еще работают на основном узле.
Итак, срабатывает ограждение, просто чтобы убедиться, что основной хост действительно не работает, и как только команда ограждения пройдет, будет считаться безопасным запуск служб на дополнительном хосте.