Назад | Перейти на главную страницу

В настоящее время нечитаемые сектора на диске RAID 5 linux

У меня каждые 30 минут появляются сообщения smartd в / var / log / messages:

smartd [3588]: Устройство: / dev / sdc, 176 Текущие нечитаемые (ожидающие) сектора

Этот диск (sdc) является частью RAID 5, настроенного с помощью mdadm. Монитор Mdadm сообщает, что с RAID все в порядке, но я хочу знать, нужно ли мне менять диск или нет. Также, если необходимо пометить как плохие эти сектора или ОС уже сделали это. Если мне нужно заменить диск, как я могу выбрать другой? Я не могу найти количество блоков в спецификациях жесткого диска, поэтому, если я выберу тот, у которого меньше блоков, чем в оригинале, у меня будут проблемы. Спасибо.

Да, поменять диск.

Нечитаемые (ожидающие) сектора - это сектор, содержимое которого не может быть прочитано. В нормальной ситуации без RAID, это может привести либо к ошибке чтения, либо к длительной задержке, когда диск пытается прочитать сектор снова и снова, пока это не удастся (или пока он в конечном итоге не откажется).

С RAID происходят две вещи:

  1. Ваш диск, вероятно, настроен с коротким значением TLER. Таким образом, он откажется от попыток прочитать этот сектор в течение разумного времени. (Таким образом предотвращаются длительные зависания).
  2. Ваш RAID-массив обнаруживает сбой и считывает данные с другого диска. В этом преимущество RAID 5; у вас есть запасная копия.

Что вы хотите сделать:

  1. Проверьте свои резервные копии. Они вам не понадобятся если все пойдет хорошо.
  2. Принесите запасной диск того же или большего размера. Вы можете проверить размер с помощью smartctl -a /dev/sdc. Не предполагайте, что все диски размера X имеют одинаковую емкость. Производители любят круглые числа; один диск на 500 ГБ может быть меньше другого диска на 500 ГБ.
  3. Вывести диск с проблемами в автономный режим. (mdadm --manage --remove /dev/mdX /dev/sdc)
  4. Замените диск новым оборудованием и позвольте массиву восстановиться. (mdadm --add /dev/mdX /dev/sdc)

Если вы использовали большие диски, то это займет много времени. Иногда быстрее просто восстановить массив RAID с нуля и восстановить из резервных копий. (Сначала ПРОВЕРЬТЕ эти резервные копии!)

Пока RAID восстанавливается, у вас нет избыточности. Таким образом, если другой диск выходит из строя (например, из-за напряжения восстановления), у вас есть проблема. Иногда это происходит с большими дисками (длительное время восстановления) и партиями дисков с одной даты.