Назад | Перейти на главную страницу

HP Proliant DL380 G6 - Восстановление после сбоя 2-го диска во время восстановления RAID 1

** Отказ от ответственности, я недавно стал администратором этой системы и понял, что резервные копии непригодны для использования. К тому же состояние программного обеспечения администрирования ужасное **

В системе (Ubuntu 14.04) использовались два диска SAS емкостью 146 ГБ 10k в RAID 1 (A и B). Корпуса поддерживают горячую замену, поэтому сервер выполнял и продолжает выполнять этот процесс.

Моя цель - определить источник сбоя диска B и, если это что-то небольшое, например, ошибка нечитаемого блока, либо перезапустить систему с помощью диска B, либо принудительно перестроить массив, несмотря на ошибки. Главное - определить, как заставить контроллер массива сообщить о режиме отказа и рассматривать отказавший диск как исправный.

Я хочу восстановить только несколько небольших файлов конфигурации, чтобы облегчить себе жизнь при переустановке.

Сервер в настоящее время находится в ограниченном состоянии, но определенно не загрузится с диска C при перезапуске, так как части / bin / были потеряны. Удивительно, но он все еще выполняет свою функцию, поскольку регулярно используется только для dhcp и ssh.

В конце концов я решил эту проблему, и мне действительно удалось восстановить большинство конфигураций.

Файловая система была смонтирована как доступная только для чтения, так как Linux обнаружил ошибку и попытался предотвратить дальнейшие повреждения.

  1. Перезагрузите систему на live CD, при появлении запроса raid заставьте систему игнорировать [недавно] мертвый диск.

  2. Установите HP Array Configuration Utility (HPACUCLI), чтобы проверить статус рейда, смонтировать диск и создать резервную копию файлов, которые я могу (всего ~ 24 часа в сутки)

  3. Удалите Live CD и перезапустите, загрузившись в исходную ОС (которая действительно работала!)

  4. Бегать fsck на исходном диске (много /home/ данные были потеряны, но это не было проблемой)

  5. Замените только что вышедший из строя диск, настройте правильную стратегию резервного копирования, чтобы этого больше не повторилось.