Сначала я хотел бы сказать о конфигурации рейда моего сервера. Intel RAID 10 (4 * 1 ТБ HDD) два от wd, 1 от Hitachi, 1 от seagate + 1 seagate в качестве горячего резерва Вот и проблема: последний жесткий диск seagate вышел из строя, и даже был горячий резерв, он не был заменен автоматически тогда Я нашел его и вручную заменил «горячий» резерв на место вышедшего из строя жесткого диска. Затем, включив его, я обнаружил, что он перестраивается. Позже он выдал сообщение об ошибке «Не удалось перестроить из-за ошибки целевого диска», после чего я перезагрузил сервер, я не могу найти замененный жесткий диск в списке рейдов из-за некоторой работы, которую я оставил. При включении сегодня я получил это сообщение об ошибке из BIOS, и этот жесткий диск также был добавлен в этот список, в журнале было следующее: «Если вы считаете, что эти PD не содержат нужной конфигурации, пожалуйста, выключите систему, удалите эти PD и перезагрузите компьютер. . " а отметки времени были только 01,02,03. Извините за языковую проблему.
Если ваши файловые системы сообщают, что они не повреждены и данные не повреждены, вам повезло. Сделайте полную резервную копию СЕЙЧАС! Это всегда нужно делать в первую очередь, когда вы видите, что ваша система хранения неисправна, т.е. ведет себя странно.
Я не совсем понял, какую технологию RAID вы используете. Intel не производит чипы RAID, они предлагают либо ребрендинг LSI MegaRAID, либо «Intel Matrix Storage Manager». Первое - это хорошо и странно иметь описанные вами проблемы. Последние - это поддельные RAID, которые, как известно, довольно нестабильны и ненадежны. Я мог вспомнить только несколько случаев, когда он действительно пережил перестройку, и много случаев, когда IMSM RAID помогал нам сохранять данные, но при этом сильно болел.
В последнем случае я предлагаю вам не восстанавливать текущую настройку, а перейти с IMSM на настоящий аппаратный RAID или на полностью программно определяемый массив. У Windows есть такая возможность, когда диски преобразуются в динамические, а программный RAID Linux хорошо известен своей гибкостью и надежностью.
Если вы не хотите переходить с поддельного RAID, я предлагаю вам попытаться полностью стереть метаданные с запасных дисков, а затем снова использовать их в качестве запасных. Это должно заставить каждую часть системы забыть об этих дисках. Вам нужно извлечь запасной, подключиться к другому компьютеру и заполнить его нулями (в Linux я использую dd if = / dev / zero of = / dev / sdX; не могу предложить никакого решения для Windows, для этого Google), тогда его можно было бы снова попробовать в массиве.
Не обращайте внимания на утверждения о разных дисках. Все расчеты наработки на отказ массивов с резервированием предполагают, что диски иногда выходят из строя независимо. Если вы используете одни и те же диски от одного производителя при одинаковой нагрузке (как это часто наблюдается на новых серверах), они будут иметь одинаковые производственные характеристики и дефекты, а причины отказов дисков будут одинаковыми. Поэтому, если один из них потерпел неудачу, вы должны ожидать, что другие вскоре потерпят неудачу, то есть не будут независимыми. Обычные предположения о надежности массива совершенно неверны, если вы используете аналогичные диски! Я видел некоторые системы, в которых сработал запасной диск, но какой-то другой диск умер во время процесса восстановления, поэтому массив только усложнил извлечение данных только потому, что кто-то установил все те же диски!
Однако, если вы сознательно используете разные диски, можно предположить, что эти диски не имеют одинаковых характеристик и дефектов. Они действительно потерпят неудачу самостоятельно. Только в этом случае оправдаются известные расчеты и ожидания надежности массивов! Поэтому, если вам нужна настоящая избыточность, а не просто шикарная картина полок с тысячами одних и тех же дисков, вы всегда будете использовать разные диски. И убить огнем всех, кто предлагает использовать «одинаковые диски одного производителя и одной серии».