У нас есть старый сервер HP DL380G5 с 5 3,5-дюймовыми дисками SCSI по 300 ГБ в массиве RAID5 во внешнем отсеке, отформатированный как логический том с файловой системой ext3, на котором размещается 1,2 ТБ конфиденциальных данных клинических пациентов.
Два диска показали прогнозируемый сбой в hpacucli, поэтому я сначала заменил один из них и увидел, что все в порядке, но я не заметил, что на нем также написано «Готов к восстановлению». Я совершенно неосторожно поменял и второй, и теперь он говорит, что RAID НЕ СБОЙ.
Я вернул старый диск, попытался перезагрузить сервер, но теперь он переводит меня в режим восстановления во время загрузки и сообщает, что не может найти логический том.
Что я могу сделать, чтобы восстановить это? К сожалению, у нас нет резервной копии. Любая помощь будет очень признательна!
Я думал о возврате ОБЕИ старых дисков, есть ли шанс, что это оживит RAID?
Мне жаль. Но это ошибка оператора.
У вас было два отказавших диска в массиве RAID5, и вы удалили больше дисков, чем массив может выдержать.
Делать это без резервных копий - большая ошибка.
Вам следует связаться с фирмой по восстановлению данных, чтобы попытаться восстановить данные со сломанного логического диска.
Не включайте систему снова. Выключите его, позвоните в службу восстановления данных. Существует ряд сервисов, позволяющих удаленно восстанавливать такие неисправности. На данный момент все, что вы можете сделать, это сделать только хуже.
Это часто включает в себя подключение всех дисков напрямую к заведомо исправному HBA (не RAID-карте или другому контроллеру!) И запуск определенного загружаемого образа Linux с инструментами удаленного управления. Затем компания получает удаленный доступ к системе, оценивает состояние диска и восстанавливает все оставшиеся метаданные RAID. Используя проприетарное программное обеспечение, они могут повторно собрать виртуальный диск RAID (техническая деталь: часто то, что подключается к стандартной системе отображения устройств Linux). Затем это открывает доступ к программному обеспечению RAID только для чтения (без ускорителя RAID SoC). Следующие шаги - проверка того, что данные не повреждены после использования, и клонирование виртуального диска на новый диск для завершения восстановления данных. После этого вы можете беспокоиться о том, чтобы система снова заработала.
Хотя я не собираюсь здесь называть какие-либо сервисы, большинство из них легко найти, и для тех, у кого есть удаленные сервисы (избавляя вас от необходимости отправлять им диски RAID + диск восстановления и ждать восстановления + клон и затем они отправляют их обратно) вы получаете преимущество в том, что данные никогда не покидают ваш объект.
Небольшое количество хороших новостей: если RAID-контроллер (или вы) не записал никаких новых данных на какой-либо из дисков и предупреждение о сбое не является предупреждением о сбое, вероятность практически равна 99,9999%. хорошая команда восстановления данных может восстановить все это, причем достаточно быстро.
Re: восстановление старых дисков.
Поскольку ваш RAID-массив полностью мертв в своем нынешнем виде, вам нечего терять, переставляя два диска до отказа.
Установите их в оригинальные отсеки.
Помните, что они до отказа, а не сразу, поэтому есть большая вероятность, что они будут работать достаточно долго, чтобы спасти ваши данные.
Есть шанс, что рейд просто не состоится, и небольшой шанс, что контроллер попросит «сбросить» рейд (выберите НЕТ / ОТМЕНА), и небольшой шанс, что рейд-контроллер может автоматически сбросить рейд, что отменит любое значение добавлено фирмой по восстановлению данных.
Так что ваш главный приоритет, если появится RAID, - это удалить данные. Это означает наличие как минимум 1,2 ТБ свободного места, готового к копированию данных, а также такого инструмента, как robocopy
или xcopy32
или в вашем случае Linux rsync
готов для запуска. Вы не хотите тратить время на чтение страниц руководства и выяснение синтаксиса, если ваши диски тратят свои последние минуты.
Как только ваши данные будут в безопасности, воссоздайте рейд как raid6 с новыми дисками. Вы потеряете 300 ГБ емкости, но получите допуск с двумя дисками. Или добавьте дополнительный диск и рассмотрите raid10 более 6 дисков. Или подумайте о полном отказе от этой машины; G5 уже более 10 лет, и он действительно больше не подходит для важных производственных задач.
И не пытаясь вставить загрузку, но также настройте правильное решение для резервного копирования. Будет в следующий раз.