У меня есть сервер Solaris 5.10 (я думаю, что он считается Solaris 10) - назовем его «Билл» - который у меня есть, но поставщик поддерживает установленное дополнительное программное обеспечение. Они должны вручную остановить службы и убедиться, что данные сброшены в его локальную базу данных перед перезагрузкой. Иначе бы перезагрузил.
«Билл» делает резервные копии на сервере NFS под управлением Ubuntu 16 LTS. Другие серверы Unix (5.) 9 на сайте также делают резервные копии на этом сервере.
В «Билле» я получаю пять ошибок с интервалом в минуту: «Ошибка соединения NFS для сервера 10.0.2.18: ошибка 5 (RPC: время ожидания истекло)», когда я пытаюсь смонтировать общий ресурс. После пятого я получаю «nfs mount: mount: / nfsmnt: Connection timed out». Я не полагаюсь на DNS, чтобы найти сервер NFS, 10.0.2.18. showmount -e 10.0.2.18
правильно сообщает об экспорте NFS.
export list for 10.0.2.18:
/data 10.0.0.0/16
Я могу изменить свойства экспорта, перезапустить службы NFS на сервере, и «Билл» увидит изменения.
«Билл» может монтировать другие общие ресурсы NFS внутри и за пределами той же подсети. Другие клиенты в одной и той же подсети и без нее могут без проблем смонтировать общий ресурс / data на сервере NFS.
rpcinfo -p 10.0.2.18
сообщает NFS v4 с tcp / udp поддерживается. Однако я не хочу использовать udp.
program vers proto port service
100000 4 tcp 111 rpcbind
100000 3 tcp 111 rpcbind
100000 2 tcp 111 rpcbind
100000 4 udp 111 rpcbind
100000 3 udp 111 rpcbind
100000 2 udp 111 rpcbind
100005 1 udp 52533 mountd
100005 1 tcp 33303 mountd
100005 2 udp 52711 mountd
100005 2 tcp 60660 mountd
100005 3 udp 34912 mountd
100005 3 tcp 50746 mountd
100003 2 tcp 2049 nfs
100003 3 tcp 2049 nfs
100003 4 tcp 2049 nfs
100227 2 tcp 2049 nfs_acl
100227 3 tcp 2049 nfs_acl
100003 2 udp 2049 nfs
100003 3 udp 2049 nfs
100003 4 udp 2049 nfs
100227 2 udp 2049 nfs_acl
100227 3 udp 2049 nfs_acl
100021 1 udp 53804 nlockmgr
100021 3 udp 53804 nlockmgr
100021 4 udp 53804 nlockmgr
100021 1 tcp 44612 nlockmgr
100021 3 tcp 44612 nlockmgr
100021 4 tcp 44612 nlockmgr
Кажется, что клиент NFS запущен. Сегодняшняя дата отображается, потому что я остановил и перезапустил клиент NFS с помощью svcadm
.
# svcs -xv nfs/client
svc:/network/nfs/client:default (NFS client)
State: online since Sun Dec 11 18:45:40 2016
See: man -M /usr/share/man -s 1M mount_nfs
See: /var/svc/log/network-nfs-client:default.log
Impact: None
Файл журнала, указанный в строке «Просмотр», сообщает
# tail /var/svc/log/network-nfs-client:default.log
[ Nov 17 17:13:47 Stopping because service disabled. ]
[ Nov 17 17:13:47 Executing stop method ("/lib/svc/method/nfs-client stop") ]
[ Nov 17 17:13:48 Method "stop" exited with status 0 ]
[ Nov 17 17:15:29 Executing start method ("/lib/svc/method/nfs-client start") ]
[ Nov 17 17:15:29 Method "start" exited with status 0 ]
[ Dec 11 18:45:39 Stopping because service restarting. ]
[ Dec 11 18:45:39 Executing stop method ("/lib/svc/method/nfs-client stop") ]
[ Dec 11 18:45:39 Method "stop" exited with status 0 ]
[ Dec 11 18:45:39 Executing start method ("/lib/svc/method/nfs-client start") ]
[ Dec 11 18:45:40 Method "start" exited with status 0 ]
Я выключил сервер NFS в понедельник 5 декабря, чтобы установить память. Той ночью, 6 декабря, в 2 часа ночи была последняя удачная резервная копия. Таймауты начались после этого, когда следующее запланированное резервное копирование, 12/7 2am, попыталось запустить.
df -kh
и ls
против точки монтирования, истекшей до моего umount /nfsmnt
.
Эта проблема с тайм-аутом произошла пару месяцев назад, и перезагрузка исправила поведение. Сервер работал 24 дня, первые 20 из которых были выполнены успешно. Никаких изменений межсетевого экрана.
Похоже, проблема связана с вашим сервером NFS. И, возможно, с этим связаны перебои в установке памяти на сервере NFS.
Кроме того, вы можете проверить, синхронизировано ли время на серверах.