У меня есть ситуация, когда один из трех разных клиентов NFS сломается через некоторое время (некоторое количество дней). Я обнаружил, что сломанный хост и сервер постоянно отправляют пакеты подтверждения (со скоростью 100+ МБ / с). Каждая сторона отправляет один и тот же пакет, и ни одна из сторон никогда не передает никаких фактических данных повторно. 1 В конце концов сервер сбросит соединения, и NFS будет работать правильно в течение короткого времени (2-4 минуты). Перезапуск сервера исправит все, пока через несколько дней он не сломается.
Среда является дубликатом другой среды, и у других клиентов NFS никогда не возникает этой проблемы (те же версии ОС и приложений).
Во время устранения неполадок я вижу, что wirehark сообщает о пакете как о «невидимом сегменте TCP ACKed», но я не понимаю почему. Пакет № 28517 имеет Ack = 2194563093, а пакет № 28513 имеет Seq = 2194563093 ... это пакет, который подтверждается, верно? Я сделал еще один чистый снимок, который выглядит так же, поэтому я не понимаю, почему он так проявляется. 2
В первую очередь я ищу подсказки по отладке проблемы NFS (SLES на стороне клиента, EMC VNX на стороне сервера) и подтверждения того, что вывод wirehark неверен (или это реальная подсказка, которую я должен вникнуть).
РЕДАКТИРОВАТЬ: сервер и клиент находятся на одном коммутаторе, в одной подсети.