У нас есть конфигурация RAID 5 (Megaraid SAS ROMB) с физическими дисками 4 930 ГБ, работающими как виртуальный диск на 2,7 ТБ. Недавно (несколько месяцев назад) у нас произошел сбой диска, и нам пришлось оставить его в деградированном режиме на долгие годы (различные факторы, хотелось бы, чтобы мы этого не сделали, но это не входит в объем вопроса). Мы заменили диск и восстановили. За последние несколько недель мы отметили постоянные невосстановленные средние ошибки на одном из физических дисков - в основном те же ошибки, которые предшествовали первому отказу, и так же часто, как и непосредственно перед тем, как он произошел (примерно 5 инцидентов в минуту, регистрация 4-8 ошибок на инцидент) . К счастью, сейчас бюджет гораздо лучше, поэтому у нас есть запасной диск.
Единственная проблема, единственное, что для меня здесь ново, заключается в том, что мы выполняем действия с массивом, который с точки зрения MegaRAID Storage Manager все еще является оптимальным. Есть много информации о замене диска в деградированном массиве (не говоря уже о том, что я бы просто повторял те же шаги, что и раньше), но я не могу найти никакой дополнительной информации о том, как это сделать упреждающе, до того, как диск выйдет из строя.
Я считаю, что процесс, по сути, тот же, с добавлением первого шага, но я бы очень признателен за исправление, если я пропустил здесь отметку:
В диспетчере хранилища отметьте соответствующий физический диск как автономный (если у меня есть правый конец флешки, это приведет к переходу виртуального диска в режим пониженной производительности)
Выключите компьютер
Заменить диск
Включи компьютер
Начать восстановление
Насколько сильно я испортил эти шаги? (это, возможно, стоит отметить, и это причина моей двойной проверки здесь, компьютер - это тоже DC)
Я управлял / искажал несколько массивов RAID 5 на протяжении многих лет, и при работе с этим сценарием у меня всегда перехватывает дыхание. Вы должны быть в состоянии выполнить эти точные шаги (без шага 1), а контроллер должен выяснить, что вы сделали, и перестроить массив. В основном контроллер видит, что диск в слоте отсутствует и что новый необходимо сложить в массив.
Я думаю, что любой согласится с тем, что перед тем, как предпринять эти шаги, всегда полезно сначала создать резервную копию важных данных - я уверен, что вы уже это сделали :)
Что должно быть хуже, так это то, что контроллер ничего не делает с новым диском, а просто запускает массив с ухудшенным качеством, пока вы не замените отсутствующий диск. Если бы это был более старый контроллер, я бы больше боялся, но, учитывая, что это контроллер последней модели, он определенно должен иметь возможность делать это разумно.