В настоящее время мы запускаем трехузловой кластер на Gluster 3.6.4.
На одном из наших узлов мы заметили, что демон glusterd мертв.
Но демоны glusterfsd все еще работают, и мы считаем, что клиенты подключаются и получают данные.
Мы заметили, что демон мертв уже неделю, и мы его не видели. Распределенные монтирования NFS продолжали нормально работать
Мы хотели бы знать можем ли мы просто пойти дальше и снова запустить сервис glusterd?
Если да, вызовет ли это самоисцеление на всех томах? Поскольку это может вызвать проблемы с производительностью.
Журналы для этого узла следующие:
[2016-08-19 18:01:52.804453] E [rpc-clnt.c:362:saved_frames_unwind] (--> /usr/lib64/libglusterfs.so.0(_gf_log_callingfn+0x1e0)[0x7f4f3ffca550] (--> /usr/lib64/libgfrpc.so.0(saved_frames_unwind+0x1e7)[0x7f4f3fd9f787] (--> /usr/lib64/libgfrpc.so.0(saved_frames_destroy+0xe)[0x7f4f3fd9f89e] (--> /usr/lib64/libgfrpc.so.0(rpc_clnt_connection_cleanup+0x91)[0x7f4f3fd9f951] (--> /usr/lib64/libgfrpc.so.0(rpc_clnt_notify+0x15f)[0x7f4f3fd9ff1f] ))))) 0-DAOS-client-4: forced unwinding frame type(GF-DUMP) op(DUMP(1)) called at 2016-08-19 18:01:51.886737 (xid=0x144a1d)
[2016-08-19 18:01:52.804480] W [client-handshake.c:1588:client_dump_version_cbk] 0-DAOS-client-4: received RPC status error
[2016-08-19 18:01:52.804504] W [socket.c:620:__socket_rwv] 0-glusterfs: readv on 127.0.0.1:24007 failed (No data available)
[2016-08-19 18:02:02.900863] E [socket.c:2276:socket_connect_finish] 0-glusterfs: connection to 127.0.0.1:24007 failed (Connection refused)
Если это не безопасно, что еще нам нужно сделать, чтобы решить эту проблему?
(полезная информация: в этой записи блога обсуждается разница между glusterfsd и glusterd http://blog.nixpanic.net/2013/12/gluster-and-not-restarting-brick.html )
Да, ваши тома не могут самовосстановиться без необходимого количества узлов, голосующих по проблеме. И да, он должен перезапустить процесс самовосстановления при запуске glusterd.service. Однако он будет лечить только те файлы, которые были отмечены как нуждающиеся в лечении.
Поскольку вы не заметили отсутствия демона glusterd, я предполагаю, что вы не сильно изменяете блоки / тома в этом кластере. Однако все демоны glusterfsd работают, а это означает, что в большинстве случаев самовосстановление не требуется.
Самое главное, что следует учитывать, - это то, что самовосстановление меньше похоже на чтение патруля, а больше похоже на выборочную очистку - оно работает только с файлами, которые были помечены как грязные. Имея это в виду, запуск демона glusterd не представляет большой проблемы.