Мой кластер, над которым я работал, просто начал действовать из ниоткуда ... Похоже, у меня проблема с ресурсом exportfs.
Есть идеи, как это исправить? Я ничего не могу найти для кода возврата "-2"
============
Last updated: Mon Jan 7 09:18:18 2013
Last change: Fri Jan 4 16:02:13 2013 via crmd on emserver1
Stack: openais
Current DC: emserver1 - partition with quorum
Version: 1.1.6-9971ebba4494012a93c03b40a2c58ec0eb60f50c
2 Nodes configured, 2 expected votes
9 Resources configured.
============
Online: [ emserver1 emserver2 ]
Master/Slave Set: ms_drbd_nfs [p_drbd_nfs]
Masters: [ emserver1 ]
Slaves: [ emserver2 ]
Clone Set: cl_lsb_nfsserver [p_lsb_nfsserver]
Started: [ emserver1 emserver2 ]
Resource Group: g_nfs
p_fs_nfs (ocf::heartbeat:Filesystem): Started emserver1
p_exportfs_nfs (ocf::heartbeat:exportfs): Started emserver1 (unmanaged) FAILED
p_ip_nfs (ocf::heartbeat:IPaddr2): Stopped
Clone Set: cl_exportfs_root [p_exportfs_root]
Started: [ emserver1 ]
Stopped: [ p_exportfs_root:1 ]
Failed actions:
p_drbd_nfs:1_promote_0 (node=emserver2, call=22, rc=-2, status=Timed Out): unknown exec error
p_exportfs_root:1_start_0 (node=emserver2, call=10, rc=-2, status=Timed Out): unknown exec error
p_exportfs_nfs_stop_0 (node=emserver1, call=32, rc=-2, status=Timed Out): unknown exec error
p_drbd_nfs:0_demote_0 (node=emserver1, call=19, rc=1, status=complete): unknown error
В пакете сервера ubuntu были устаревшие агенты ресурсов. В агенте ресурсов exportfs была ошибка, из-за которой размер nfs rmtab увеличивался до огромных размеров (поэтому и возникали тайм-ауты).
Я обновил агенты ресурсов с github и удалил rmtab на 2 ГБ. После этого все было хорошо.