Назад | Перейти на главную страницу

Файловый сервер Windows получил медленный ответ и высокую задержку, даже ping localhost, работая примерно через 7 дней после перезагрузки

У нас есть файловый сервер Windows Server 2012 R2 на DELL PowerEdge R720, и в последние дни у нас возникла очень странная проблема с производительностью сети / диска. В коробке есть группа дисков RAID-1 для ОС (disk0) под контроллером DELL H730P и хранилище SAN для данных (disk1).

Симптом 1:

Users complained they can not access file as usual.
Network response is very slow with high latency, even if we ping localhost.
NIC is working on teaming of NIC0 and NIC1.
Having about 300 shared folder clients, and 125 $IPC sessions.
Having about 400 opened files.

Симптом 2:

Drive C: (disk0 on RAID-1) might have an abnormal disk queue length, greater than 1, 
sometimes up to 2 or 3.

High latency accompanies abnormal disk queue length.

But drive c: only hold OS files, pagefile, and programs, it have 80% free sapces, 
all of the business data keeps in drive d: .

Симптом 3:

If we reboot the box, all the issues are gone.
But the problem comes again after running about one or two weeks.

Нам нужна ваша помощь / руководство, чтобы провести диагностику и найти первопричину.

Спасибо.

На вашем месте я бы запустил измерения производительности с помощью инструмента Windows монитор выступлений

Вы сможете увидеть, какой процесс использует ваши диски и / или использует ваши сетевые ресурсы.

Запускать тест можно сразу после перезагрузки и в течение длительного времени. Я всегда записываю выступления в течение нескольких недель.

РЕДАКТИРОВАТЬ :

Если вы можете, вы должны запустить perfmon во время событий с высокой задержкой. Потому что, если вы запустите раньше, а ответственный процесс еще не запущен, он не будет зарегистрирован в счетчиках.

другие вопросы:

  • Вы уверены, что ваш RAID на диске 0?
  • Вы пробовали с отключением команды, только один интерфейс?
  • Активированы ли у вас политики безопасности аудита для ваших общих файлов, которые записываются в ваши журналы событий?
  • У вас активировано правило FSRM для ваших общих файлов?
  • У вас есть журналы, созданные программным обеспечением?
  • Можете ли вы соотнести (с помощью perfomon) задержку в вашей сети с длиной очереди?
  • ...
  • удачи