Назад | Перейти на главную страницу

Журналы рассылки спама NFS exportfs. Это неработающая установка?

У меня есть сервер NFS под управлением Ubuntu 10.04, обслуживающий файловую систему OCFS2. Настройка несколько сложна, потому что на сервере установлены Heartbeat и Pacemaker для создания кластера с другим сервером.

Во всяком случае, странная вещь:

# tail -12 /var/log/messages
Jul 17 17:15:45 ctserv01 exportfs[14870]: INFO: Directory /export/homes is exported to 172.16.54.0/24 (started).
Jul 17 17:15:45 ctserv01 exportfs[14869]: INFO: Directory /export/proyectos is exported to 172.16.54.0/24 (started).
Jul 17 17:15:45 ctserv01 exportfs[14871]: INFO: Directory /export is exported to 172.16.54.0/24 (started).
Jul 17 17:16:15 ctserv01 exportfs[15960]: INFO: Directory /export/proyectos is exported to 172.16.54.0/24 (started).
Jul 17 17:16:15 ctserv01 exportfs[15961]: INFO: Directory /export is exported to 172.16.54.0/24 (started).
Jul 17 17:16:15 ctserv01 exportfs[15962]: INFO: Directory /export/homes is exported to 172.16.54.0/24 (started).
Jul 17 17:16:45 ctserv01 exportfs[17054]: INFO: Directory /export/proyectos is exported to 172.16.54.0/24 (started).
Jul 17 17:16:45 ctserv01 exportfs[17055]: INFO: Directory /export/homes is exported to 172.16.54.0/24 (started).
Jul 17 17:16:45 ctserv01 exportfs[17056]: INFO: Directory /export is exported to 172.16.54.0/24 (started).
Jul 17 17:17:15 ctserv01 exportfs[18168]: INFO: Directory /export is exported to 172.16.54.0/24 (started).
Jul 17 17:17:15 ctserv01 exportfs[18169]: INFO: Directory /export/proyectos is exported to 172.16.54.0/24 (started).
Jul 17 17:17:15 ctserv01 exportfs[18170]: INFO: Directory /export/homes is exported to 172.16.54.0/24 (started).

Журналы показывают, что exportfs возрождается каждые 30 секунд. Сервер NFS работает нормально большую часть времени, но через несколько дней он начинает зависать до 20 секунд каждые 13-15 минут, и люди разглагольствуют об этом.

Возможно, причиной этого является кардиостимулятор, сердцебиение или что-то еще. Или, может быть, это ожидаемое поведение, и проблема должна быть в другом месте?

Конфигурация кардиостимулятора (уведомление / экспорт / проект остановлен):

# crm configure show
node $id="06334af6-e766-457c-8c30-457080276507" ctserv01
node $id="bf53e028-9f27-4ef3-bb45-4fcef981e441" ctserv02
primitive ClusterIP ocf:heartbeat:IPaddr2 \
    params ip="172.16.54.56" cidr_netmask="24" nic="eth0"
primitive exports_nfs_home ocf:heartbeat:exportfs \
    params rmtab_backup="none" directory="/export/homes" clientspec="172.16.54.0/24" options="rw,async,no_subtree_check,insecure,root_squash" fsid="1" \
    op monitor interval="30s" \
    op start interval="0" timeout="240s" \
    meta target-role="Started"
primitive exports_nfs_proys ocf:heartbeat:exportfs \
    params rmtab_backup="none" directory="/export/proyectos" clientspec="172.16.54.0/24" options="rw,async,no_subtree_check,insecure,root_squash" fsid="2" \
    op monitor interval="30s" \
    op start interval="0" timeout="240s" \
    meta target-role="Stopped"
primitive exports_nfs_root ocf:heartbeat:exportfs \
    params rmtab_backup="none" directory="/export" clientspec="172.16.54.0/24" options="rw,async,no_subtree_check,insecure" fsid="0" \
    op monitor interval="30s" \
    op start interval="0" timeout="240s"
group grupo_nfs ClusterIP exports_nfs_root exports_nfs_home exports_nfs_proys
location nodo_preferido grupo_nfs 100: 06334af6-e766-457c-8c30-457080276507
order orden_de_recursos inf: ClusterIP exports_nfs_root exports_nfs_home exports_nfs_proys
property $id="cib-bootstrap-options" \
    dc-version="1.1.6-9971ebba4494012a93c03b40a2c58ec0eb60f50c" \
    cluster-infrastructure="Heartbeat" \
    stonith-enabled="false" \
    no-quorum-policy="ignore" \
    expected-quorum-votes="2" \
    cluster-recheck-interval="60min"

Сообщения журнала спама, которые вы видите, поступают из ocf:heartbeat:exportfs агент ресурсов. Они появляются каждые 30 секунд, что соответствует интервалу мониторинга, который вы указали в определениях примитивов exportfs. Агент ресурсов слишком многословен, IMHO, но это не должно быть проблемой. Просто убедитесь, что вы выполняете логротацию достаточно часто, чтобы журналы не заполняли ваши диски. Или отредактируйте агент ресурса, чтобы он был менее подробным.

Ваша проблема, вероятно, где-то глубже в настройке вашего кластера. Готова ли опубликованная вами конфигурация кардиостимулятора? Мне кажется, что кластер не управляет всеми необходимыми ресурсами, такими как сам сервер NFS, idmapd или bind mounts.

Общеизвестно, что NFS (под Linux) сложно получить в среде высокой доступности. Я рекомендую вам прочитать это техническое руководство по HA NFS от Linbit, ребята, которые сделали DRBD и большую часть стека Linux HA. Требуется бесплатная регистрация, но это очень хорошее и подробное руководство по настройке работающего и стабильного HA-кластера NFS. У нас несколько таких кластеров на производстве.