У меня NFS используется для 30 узлов кластера. Узлами являются Debian 5 и 6. Сервер NFS - OpenSolaris 2009. У нас хорошее оборудование и сеть Infiniband 20 Гбит.
На узлах кластера операции fs выполняются быстро, но не в том, что касается:
Rscript <(echo "library(GOstats)")
Все они застревают на несколько минут после следующих системных вызовов:
fcntl(3, F_SETLK, {type=F_WRLCK, whence=SEEK_SET, start=1073741824, len=1}
илиfcntl(3, F_SETLK, {type=F_RDLCK, whence=SEEK_SET, start=1073741824, len=1}
Что может быть причиной? Как диагностировать и исправить?
Переключит ли сервер NFS на OpenIndiana oi_148 исправить?
Посмотрите, работает ли на сервере служба блокировки NFS.
Эти системные вызовы получить блокировку файла. Возможно, другой процесс в настоящее время имеет блокировку, и ваши зависшие процессы ждут, когда эта блокировка будет снята. Есть несколько советов по устранению неполадок (для более старой версии Solaris, но они могут быть полезны) в Глава 11 О'Рейли Управление NFS и NIS, 2-е издание.
Обновлен до последней версии OpenIndiana. Проблема исчезла.