Назад | Перейти на главную страницу

Общий ресурс NFS внезапно перестает отвечать

У нас есть установка, включающая отдельные веб-серверы и серверы электронной почты, устанавливающие различные общие ресурсы на одном физическом сервере NFSv3.

Веб-сервер использует общий ресурс для файлов apache vhost, почтовый сервер использует общий ресурс для почты пользователя. (Формат Maildir, courier-imap)

Почтовый сервер внезапно и без предупреждения, кажется, случайным образом «блокируется» из-за того, что общий ресурс nfs перестает отвечать. 'df' зависает, когда попадает в смонтированный общий ресурс nfs. Любая попытка получить доступ к общему ресурсу изнутри системы фактически приводит к зависанию процесса.

Веб-сервер пока остается незатронутым, поэтому я хотел бы думать, что мы можем исключить проблемы на сервере NFS. И в Интернете, и в электронной почте используются одни и те же параметры монтирования, которые я пробовал несколько комбинаций, но безрезультатно. Иногда он работает без проблем в течение нескольких недель, но мы просто заблокировали его менее чем через 24 часа после увеличения количества потоков NFS на сервере и повторного подключения общих ресурсов.

Есть комментарии или предложения?

Выход rpcinfo:

rpcinfo -p localhost

program vers proto   port
100000    2   tcp    111  portmapper
100000    2   udp    111  portmapper
100024    1   udp  32768  status
100024    1   tcp  60949  status
100021    1   udp  32769  nlockmgr
100021    3   udp  32769  nlockmgr
100021    4   udp  32769  nlockmgr
100021    1   tcp  41693  nlockmgr
100021    3   tcp  41693  nlockmgr
100021    4   tcp  41693  nlockmgr


rpcinfo -p $nfs_server

program vers proto   port
100000    2   tcp    111  portmapper
100000    2   udp    111  portmapper
100024    1   udp    752  status
100024    1   tcp    755  status
100011    1   udp    613  rquotad
100011    2   udp    613  rquotad
100011    1   tcp    616  rquotad
100011    2   tcp    616  rquotad
100003    2   udp   2049  nfs
100003    3   udp   2049  nfs
100003    4   udp   2049  nfs
100021    1   udp  37709  nlockmgr
100021    3   udp  37709  nlockmgr
100021    4   udp  37709  nlockmgr
100003    2   tcp   2049  nfs
100003    3   tcp   2049  nfs
100003    4   tcp   2049  nfs
100021    1   tcp  54549  nlockmgr
100021    3   tcp  54549  nlockmgr
100021    4   tcp  54549  nlockmgr
100005    1   udp    651  mountd
100005    1   tcp    654  mountd
100005    2   udp    651  mountd
100005    2   tcp    654  mountd
100005    3   udp    651  mountd
100005    3   tcp    654  mountd

По моему опыту. NFS печально известен подобными проблемами. Может быть, это связано с проблемой с вашим сетевым коммутатором?

Доступны ли веб-сервер и почтовый сервер к одному и тому же серверу NFS? Если нет, попробуйте переместить сервер NFS для вашей электронной почты на другой сетевой порт и посмотрите, поможет ли это.

В противном случае попробуйте некоторые из этих параметров в вашем файле fstab. увеличивайте таймауты. Установите мягкий вариант. Вы также можете попробовать опцию fsc (кеш файловой системы). Я надеюсь, что он кэширует операцию записи и решит вашу проблему.

Видеть: http://linux.die.net/man/5/nfs

Кстати, ваш веб-сервер в основном читает. Ваш почтовый сервер в основном выполняет записи.

Если все это не помогло, я бы подумал об отказе от nfs и использовании вместо этого iSCSI.