У нас есть установка, включающая отдельные веб-серверы и серверы электронной почты, устанавливающие различные общие ресурсы на одном физическом сервере NFSv3.
Веб-сервер использует общий ресурс для файлов apache vhost, почтовый сервер использует общий ресурс для почты пользователя. (Формат Maildir, courier-imap)
Почтовый сервер внезапно и без предупреждения, кажется, случайным образом «блокируется» из-за того, что общий ресурс nfs перестает отвечать. 'df' зависает, когда попадает в смонтированный общий ресурс nfs. Любая попытка получить доступ к общему ресурсу изнутри системы фактически приводит к зависанию процесса.
Веб-сервер пока остается незатронутым, поэтому я хотел бы думать, что мы можем исключить проблемы на сервере NFS. И в Интернете, и в электронной почте используются одни и те же параметры монтирования, которые я пробовал несколько комбинаций, но безрезультатно. Иногда он работает без проблем в течение нескольких недель, но мы просто заблокировали его менее чем через 24 часа после увеличения количества потоков NFS на сервере и повторного подключения общих ресурсов.
Есть комментарии или предложения?
rpcinfo -p localhost
program vers proto port
100000 2 tcp 111 portmapper
100000 2 udp 111 portmapper
100024 1 udp 32768 status
100024 1 tcp 60949 status
100021 1 udp 32769 nlockmgr
100021 3 udp 32769 nlockmgr
100021 4 udp 32769 nlockmgr
100021 1 tcp 41693 nlockmgr
100021 3 tcp 41693 nlockmgr
100021 4 tcp 41693 nlockmgr
rpcinfo -p $nfs_server
program vers proto port
100000 2 tcp 111 portmapper
100000 2 udp 111 portmapper
100024 1 udp 752 status
100024 1 tcp 755 status
100011 1 udp 613 rquotad
100011 2 udp 613 rquotad
100011 1 tcp 616 rquotad
100011 2 tcp 616 rquotad
100003 2 udp 2049 nfs
100003 3 udp 2049 nfs
100003 4 udp 2049 nfs
100021 1 udp 37709 nlockmgr
100021 3 udp 37709 nlockmgr
100021 4 udp 37709 nlockmgr
100003 2 tcp 2049 nfs
100003 3 tcp 2049 nfs
100003 4 tcp 2049 nfs
100021 1 tcp 54549 nlockmgr
100021 3 tcp 54549 nlockmgr
100021 4 tcp 54549 nlockmgr
100005 1 udp 651 mountd
100005 1 tcp 654 mountd
100005 2 udp 651 mountd
100005 2 tcp 654 mountd
100005 3 udp 651 mountd
100005 3 tcp 654 mountd
По моему опыту. NFS печально известен подобными проблемами. Может быть, это связано с проблемой с вашим сетевым коммутатором?
Доступны ли веб-сервер и почтовый сервер к одному и тому же серверу NFS? Если нет, попробуйте переместить сервер NFS для вашей электронной почты на другой сетевой порт и посмотрите, поможет ли это.
В противном случае попробуйте некоторые из этих параметров в вашем файле fstab. увеличивайте таймауты. Установите мягкий вариант. Вы также можете попробовать опцию fsc (кеш файловой системы). Я надеюсь, что он кэширует операцию записи и решит вашу проблему.
Видеть: http://linux.die.net/man/5/nfs
Кстати, ваш веб-сервер в основном читает. Ваш почтовый сервер в основном выполняет записи.
Если все это не помогло, я бы подумал об отказе от nfs и использовании вместо этого iSCSI.