У нас есть Windows Storage Server (2003 R2), который служит NAS для нашей компании. За последние несколько недель мы начали испытывать периодические «обрывы», когда клиент ненадолго теряет соединение с сервером. Это может быть при попытке доступа к подключенному диску или пути UNC. Когда это происходит, они обычно получают одно из трех сообщений об ошибке:
Папка не существует
Каталог не существует
Указанное сетевое имя больше не доступно
Обычно в течение нескольких секунд после сброса вторая или третья попытка оказывается успешной, и все в порядке. Однако это наносит ущерб многим нашим производственным процессам, которые не работают.
Когда это происходит, похоже, что это влияет на всех клиентов, которые в этот момент пытаются получить доступ к NAS. В какой-то момент мы думали, что решили ее, заменив неисправный жесткий диск в массиве рейдов, но проблема не исчезла, и мы фактически начинаем видеть ее на другом NAS с таким же оборудованием (и того же возраста). Это оба сервера с истекшим сроком службы, которые давно следовало заменить.
Примечательных журналов в журналах событий сервера, журналах рейдов или журналах переключения не обнаружено. Уязвимые клиенты варьируются от компьютеров с Linux до компьютеров с Windows.
Мы будем благодарны за любую помощь или совет. Я думаю, мы собираемся попробовать анализ пакетов и посмотреть, сможем ли мы что-нибудь увидеть таким образом. Хотя не уверен, какой инструмент подойдет для этого.
Обновить
Я пробовал использовать NetMon, но трафик обмена файлами настолько велик, что сервер не успевает за анализом пакетов.