Назад | Перейти на главную страницу

Производительность файловой системы снизилась во время восстановления RAID

Итак, быстрый вопрос - наш массив RAID6 в настоящее время перестраивается, и производительность файловой системы ОЧЕНЬ заметна (домашние каталоги смонтированы по NFS в массиве).

Я как бы ожидал этого, учитывая, что вы перестраиваете массив, поэтому на контроллере возникает огромная нагрузка чтения / записи, но мне пришло в голову, что мне действительно не с чем сравнивать.

Наблюдается серьезное (довольно частое зависание на 5-10 секунд) ожидаемое поведение во время восстановления RAID в сочетании с интенсивным использованием чтения / записи (производительность заметно снижается во время резервного копирования и когда пользователи загружают большие файлы [несколько ГБ] через FTP).

Любые мысли по этому поводу будут оценены. Это аппаратный RAID6 (LSI 9266-i8) на массиве 40 ТБ, смонтированном локально поверх NFS (т.е. сервер физически находится очень близко к рабочим станциям).

Во-первых, вот отличный ресурс, который описывает время восстановления.

Восстановление RAID и то, как они работают до и после сбоя.

Что касается моих мыслей о перестроении, мы действительно знаем, что перестройки приводят к действительно медленной производительности, и это справедливо. Как вы увидите из моей ссылки выше, восстановление RAID - это не только извлечение информации с неисправного диска на хорошо известные диски (в случае восстановления после сбоя), они также записывают информацию на системный диск, а также другие данные. / secondary все время работает на дисках. Также следует иметь в виду, что обычные функции, которые обычно не требуют времени и относительно небольшие ресурсы, теперь требуют больше ресурсов, чем обычно, и облагают налогом уже облагаемый налогом сервер. В случае сбоя перед перестроением (немного лучше по производительности, но не намного), вам может повезти, и у вас может произойти сбой диска (логического или физического) и восстановление RAID до конечных пользователей (надеюсь, у вас как у SA должны быть некоторые своего рода система оповещения, так что вы не должны удивляться ей) даже знать, что у чего-то была проблема.

5-10 секундные зависания, которые вы видите, определенно нормальны, особенно если сервер, на котором вы перестраиваете, является сервером базы данных любого типа, который по умолчанию имеет большее количество операций записи и чтения (т. Е. SQL-сервер, содержащий базу данных, к которой имеют доступ конечные пользователи). в течение всего дня; у компании по управлению недвижимостью, которую я раньше консультировал, была программа, которая в течение всего дня обращалась к их записям арендаторов для просмотра и записи им новой информации, и она всегда использовалась интенсивно). Это будет более заметно.

Еще я рекомендую получить любую утилиту RAID (версия с графическим интерфейсом), поставляемую с вашим контроллером, и установить ее в операционной системе, чтобы вы могли отслеживать перестройку без необходимости загружать в BIOS контроллера.

В наши дни очень небольшая и почти несуществующая проблема - это NFS и iSCSI. Я знаю, что вы используете NFS, и раньше iSCSI будет иметь лучшую общую производительность в случае виртуализации, но с недавними улучшениями гипервизоров и жестких дисков, а также контроллеров, NFS почти идентична iSCSI по производительности, поэтому Похоже, у вас очень хороший SAN.

Я был бы рад ответить на все, что вам нужно знать, поэтому, пожалуйста, не стесняйтесь комментировать.