У нас есть 16-дисковый RAID-6 с тремя проблемными дисками. Двое уже мертвы, а третий выдает предупреждения SMART. (Неважно, как он попал в такое плохое состояние.)
Очевидно, мы хотим заменить мертвые диски перед тем, который все еще работает, но лучше ли:
замените один мертвый диск, позвольте RAID восстановиться, затем замените другой и позвольте ему снова построить; или
заменить оба диска сразу и позволить восстанавливать оба параллельно?
Другими словами, вернемся ли мы к состоянию избыточности быстрее, повторно введя один или два диска? Замедляет ли параллельное восстановление двух дисков процесс восстановления?
В случае необходимости, контроллер - 3ware 9650SE-16ML.
!!!!! ОДИН !!!!!
Делай по одному, серьезно чувак, не думай делать это ЛЮБОЙ другой способ, хорошо.
Все остальное проверит ваши навыки полного восстановления системы.
У вас есть свежие резервные копии? Если нет, как вы думаете, сможете ли вы получить их в разумные сроки?
Честно говоря, я был бы больше обеспокоен отключением неисправного диска во время восстановления, чем чем-либо еще - если вы уже выкидываете ошибки SMART, вы более чем на полпути.
Я предлагаю подтверждать ваши резервные копии, а затем восстанавливать по одному диску, чтобы попытаться восстановить состояние, в котором вы можете заменить тот, который выдает ошибки SMART (сначала мертвые диски, а затем - мягкие ошибки).
Если у вас нет резервных копий, это чушь: резервное копирование может вызвать достаточно мягких ошибок, чтобы пометить маргинальный диск как неисправный, как и попытка восстановления.
Не вижу смысла менять его как «по одному диску за раз».
Очевидно, что если RAID может «перенастроить» оба диска одновременно (которые в любом случае потерпели неудачу) вы только выиграете, позволив всему RAID восстановить способность выдерживать до 2 сбоев Быстрее.
Мои 0,02. $
Поскольку сервер уже отключен, запустите ddrescue на диске, который вот-вот выйдет из строя, чтобы клонировать его на другой нормальный диск.
Затем вместо этого поместите в массив новый нормальный диск. Если клонирование прошло успешно, вы избежите риска отказа этого диска во время двух операций восстановления.