Назад | Перейти на главную страницу

Сервер почти не работает при записи на диск

Мой вопрос тесно связан с мой последний вопрос вот на serverfault.

Я копировал около 5 ГБ с настольного компьютера 10-летней давности на сервер. Копирование было выполнено в проводнике Windows. В этой ситуации я бы предположил, что серверу надоедает поток данных.

Но как обычно с этим сервером очень сильно тормозил. По крайней мере, я мог работать с удаленным сеансом, даже если была серьезная задержка. Копирование заняло свое время (20мин?). В этот раз я пошел к коллеге, и он попытался войти на тот же сервер через удаленный рабочий стол (по какой-то другой причине). Чтобы перейти к экрану входа в систему, потребовалось около минуты, чтобы открыть панель управления, минуту, чтобы открыть монитор производительности, ... Значки загружались, может быть, по одному в секунду. Мы видели следующее (по памяти):

На сервере не было другой значительной активности. Сервер редко обслуживает некоторые страницы ASP.NET, которые в это время также стали очень медленными.

Соответствующая конфигурация выглядит следующим образом:

Это нормальное поведение для такой конфигурации? Какие измерения могут дать дополнительные подсказки?

Это разумный снизить приоритет такого копирования ввода-вывода и отдать предпочтение другим процессам, таким как удаленный рабочий стол? Как бы Вы это сделали?

Большое спасибо!

Перегрузка диска. Так просто. Средн. длина очереди 50 - отметьте «секунд на ввод-вывод / чтение / запись» - это тоже будет слишком много.

Похоже, что вы в основном полностью перегружаете диски, и отключение режима кеширования жесткого диска тоже не помогает (плохая настройка - по крайней мере, поместите его в кеш чтения там ... лучше запись + ибп - без кеширования SATA NCQ не может работать , убивая вашу производительность).

Основная проблема - это ваш RAID 5 - на нем практически все. Область файлов И операционная система, поэтому перегрузка приводит к перегрузке всей системы.

Для реальных серверов я использую WD Scorpio Black в Raid 10 (4 диска) для операционной системы и (я использую только виртуальную) виртуализацию root - Raid 10 дает мне лучшую производительность. Для высокопроизводительного файлового сервера я бы добавил ВТОРОЙ рейд (может быть рейд 5) для файлов. Уловка здесь в том, что файловая область и область операционной системы никогда не могут перекрываться (одни и те же диски). В вашем случае - возьмите небольшой жесткий диск (80 ГБ или около того) - два из них - и поместите на них зеркало и переместите на него операционную систему. Тогда сервер все еще можно использовать, когда количество операций ввода-вывода накапливается.

Страницы в секунду ничего не говорят - это означает, что есть какая-то виртуальная память. Если это попадает на диски во время копирования файла (вероятно, но это еще один счетчик производительности, который отмечает физическую активность как результат ошибок страниц), то, естественно, он попадает в очередь.

И, пожалуйста, включите кеширование. Может ли LSI продать вам bbu (блок резервного питания от батарей?). Я сам использую Adaptec в качестве RAID-контроллера, и с тех пор, как у меня есть BBU, я поставил кэш на обратную запись (НЕ на сквозную) - прирост производительности от оптимизаций значительный.

Проблема была хорошо охарактеризована другими ответами, но вкратце:

Ваш RAID-массив с 3 (активными) дисками 7200 об / мин в RAID 5 имеет производительность записи, которая составляет примерно 3/4 скорости одного диска 7200 об / мин для расширенных копий. Учитывая, что вы отключили кеширование \ упреждающее чтение и т. Д., Производительность будет еще хуже. По большей части производительность вашего сервера с точки зрения записи будет довольно низкой с этой конфигурацией.

Если ваши 5 ГБ представляют собой один большой файл (или несколько довольно больших файлов), и если ваша сетевая копия отправляется со скоростью более 30 мегабит в секунду (достаточно просто с гигабитным подключением), то диски вашего сервера не смогут хранить вверх, буферизация сетевой копии на сервере будет расти, пока не будет израсходована вся доступная память на сервере, а затем это заставит ОС начать пейджинг, что еще больше ухудшит вашу проблему с производительностью. В зависимости от того, что на самом деле происходит на сервере, скорость копирования, необходимая для уничтожения вашей системы, может быть даже ниже, чем эта, если есть какие-либо другие устойчивые операции чтения / записи, даже с очень низкой скоростью, тогда входящая копия прерывается. 100-мегабайтного соединения может быть достаточно, чтобы вызвать такого рода проблемы.

Вы уверены, что RAID-массив не перестраивался? Я видел, как при восстановлении / проверке коробку ставили на колени. У вас может быть даже маргинальный накопитель, который не поспевает за другими, но не выдает коды ошибок (пока).

Диск «RAID» должен немедленно сообщить контроллеру, что у него есть проблема, «потребительские» (они одинаковые, но с другой прошивкой) диски будут продолжать повторять неудачный запрос вместо быстрого сбоя по умолчанию. У меня было несколько, которые в конечном итоге выпали из массива из-за тайм-аутов под нагрузкой. Они хорошо проверяли и перестраивали (обычно) без происшествий, только чтобы снова начать отсчет времени, как только коробка была под нагрузкой. Постоянные перестройки и остановка приводов приводили к остановке коробки после нескольких циклов перестройки.