Назад | Перейти на главную страницу

Как обнаружить отказ жесткого диска

У меня есть программная настройка RAID 1 в моем CentOS 6.2, и я настроен на загрузку с любого из жестких дисков в случае сбоя одного из них.

Вопросы:

  1. Как узнать, вышел ли из строя один из жестких дисков? или первые признаки отказа CentOS? (профилактика)
  2. Что делать в случае выхода из строя одного из дисков? Как и любой ВОССТАНОВЛЕНИЕ ДАННЫХ методы. (корректирующее обслуживание) или (как скопировать данные с оставшегося жесткого диска и скопировать их на новый жесткий диск)

Буду рад, если вы дадите мне какие-нибудь рекомендации.

Обновить:

Я пробовал загрузиться только с одного из дисков. Сначала я удалил sdb, и система успешно загрузилась в sda. Затем я удалил sda и загрузился в sdb, но все равно успешно загрузился. Но когда я собрал их вместе и запустил cat / proc / mdstat & mdadm -D / dev / md0, он показывает, что один из дисков все еще удален.

1 Программный рейд в Centos? Итак, это должен быть мдрайд. Вы можете увидеть статус рейда следующим образом: cat / proc / mdstat или: mdadm --detail / dev / md [0-9], который md использует, вы можете найти с помощью fstab, mount, pvs или где-нибудь еще. Игрушка также может настроить MAILADDR в /etc/mdadm.conf для уведомления по электронной почте, если произойдет какое-либо событие.

2 просто удалите неисправный диск с помощью mdadm --manage / dev / md [0-9] --remove / dev / sd [a-z], замените его и добавьте новый диск в массив рейдов (mdadm --re-add, add)

Кроме того, вам может потребоваться восстановить mbr неисправного диска, чтобы он тоже стал загрузочным.

  1. Если вам повезет (и вы включили демон), вы получите УМНАЯ предупреждения в журналах перед отказом диска. Однако это не гарантируется. По своему опыту я вижу SMART-ошибки до того, как диски взорвутся, менее чем в 50% случаев. Убедитесь, что у вас есть что-то для мониторинга журналов.
  2. После сбоя диска вы заменяете диск и восстанавливаете его. Система RAID должна оправиться от этого. Просто надейтесь, что при восстановлении у вас не будет еще одной ошибки диска ...

Я настоятельно рекомендую иметь хорошую стратегию резервного копирования вместо планирования восстановления данных. Raid идеально подходит для увеличения времени безотказной работы сервера, но все, что требуется, - это одна небольшая программная ошибка, и все ваши данные исчезнут.