У нас было около 20 хостов, подключенных к общему ресурсу NFS, запущенному с сервера Ubuntu. На днях все потеряли связь. Мы перезагрузили сервер NFS, чтобы исключить какие-либо проблемы с сервисами.
При попытке подключиться к монтированию это журнал из системного журнала на стороне Ubuntu, который выглядит нормально:
May 14 16:23:26 nas1 snmpd[2351]: Connection from UDP: [192.168.99.51]:36999->[192.168.99.41]
May 14 16:23:45 nas1 rpc.mountd[1863]: authenticated mount request from 192.168.30.1:604 for /data/nfs (/data/nfs)
А это журнал из vmkernel.log на сервере ESX:
2013-05-14T15:29:25.882Z cpu6:9124)NFS: 157: Command: (mount) Server: (nas1.4d.wirehive.int) IP: (192.168.30.51) Path: (/data/nfs) Label: (NFS) Options: (None)
2013-05-14T15:29:25.882Z cpu6:9124)StorageApdHandler: 692: APD Handle b4215f5c-3ba55d8f Created with lock[StorageApd0x41001d]
2013-05-14T15:29:25.887Z cpu6:9124)NFS: 1236: NFS FSINFO failed with NFS status 70 (Invalid handle) on Server (192.168.30.51) Path (/data/nfs)
2013-05-14T15:29:25.887Z cpu6:9124)StorageApdHandler: 739: Freeing APD Handle [b4215f5c-3ba55d8f]
2013-05-14T15:29:25.887Z cpu6:9124)StorageApdHandler: 802: APD Handle freed!
2013-05-14T15:29:25.887Z cpu6:9124)NFS: 218: NFS mount nas1.4d.int:/data/nfs status: Unable to query remote mount point's attributes
Похоже, проблемы начинаются с:
NFS FSINFO failed with NFS status 70
Что это значит? Могу предоставить любые необходимые журналы.
Всякий раз, когда я сталкиваюсь с проблемами NFS с ESXi, я прорабатываю эту статью базы знаний: http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=1003967
$ vmkping - I
довольно здорово, так как вы можете выделить vmkernel
вы хотите использовать.
Кроме того, если вы используете ESXi 4.x или новее nc
(также известный как netcat) отлично подходит для проверки отсутствия проблем с брандмауэром.
Для вас попробуйте что-нибудь вроде:
$ nc -z 192.168.30.51 2049