У меня есть Dell PowerEdge 2950 с этой картой: Контроллер шины RAID [0104]: Расширяемый RAID-контроллер Dell PowerEdge 5 [1028: 0015] и шесть дисков в RAID-10.
Я заменил диск 2, потому что он не появился, а затем он начал восстанавливать себя:
root@backup01:~# megaraidsas-status
-- Arrays informations --
-- ID | Type | Size | Status
a0d0 | RAID 10 | 5587GiB | DEGRADED
-- Disks informations
-- ID | Model | Status | Warnings
a0e8s0 | ATA ST2000DM001-9YN1 1863GiB | online | errs: media:0 other:5393
a0e8s1 | ATA ST2000DM001-9YN1 1863GiB | online | errs: media:0 other:5394
a0e8s2 | ATA ST2000DM001-1E61 1863GiB | rebuild | errs: media:0 other:99
a0e8s3 | ATA ST2000DM001-9YN1 1863GiB | online | errs: media:0 other:5393
a0e8s4 | ATA ST2000DM001-9YN1 1863GiB | online | errs: media:0 other:5393
a0e8s5 | ATA ST2000DM001-9YN1 1863GiB | online | errs: media:0 other:5393
Восстановление завершается, виртуальный диск становится оптимальным, и диск 2 переходит в оперативный режим. Затем раз в день диск 2 действует так, как будто он был удален, и восстановление начинается заново. Как мне остановить восстановление раз в день?
Event Description: Removed: PD 02(e1/s2)
Event Description: Removed: PD 02(e1/s2) Info: enclPd=08, scsiType=0, portMap=04, sasAddr=1221000002000000,0000000000000000
Event Description: State change on VD 00/0 from OPTIMAL(3) to DEGRADED(2)
Event Description: VD 00/0 is now DEGRADED1
Event Description: State change on PD 02(e1/s2) from ONLINE(18) to FAILED(11)
Event Description: State change on PD 02(e1/s2) from FAILED(11) to UNCONFIGURED_BAD(1)
Event Description: Background Initialization failed on VD 00/0
Event Description: Inserted: PD 02(e1/s2)
Event Description: Inserted: PD 02(e1/s2) Info: enclPd=08, scsiType=0, portMap=04, sasAddr=1221000002000000,0000000000000000
Event Description: PD 02(e1/s2) is not a certified drive
Event Description: State change on PD 02(e1/s2)
Event Description: State change on PD 02(e1/s2) from UNCONFIGURED_GOOD(0) to OFFLINE(10) from UNCONFIGURED_BAD(1) to UNCONFIGURED_GOOD(0)
Event Description: Rebuild automatically started on PD 02(e1/s2)
Event Description: State change on PD 02(e1/s2) from OFFLINE(10) to REBUILD(14)
Для начала ... Мне кажется, это двойной сбой / прокол данных, что означает, что у вас есть плохие блоки, которые распространяются внутри RAID. По моему опыту, это может вызвать действительно очень странные проблемы. Вы можете прочитать об этом здесь: http://www.dell.com/support/Article/us/en/04/438291/en
Есть ли шанс получить вывод журнала вашего RAID-контроллера? Установлены ли у вас пакеты администратора сервера dell open manage? Если нет, это лучшее место для начала. Похоже, у вас работает некоторая разновидность Linux, вы можете скачать пакеты OMSA: http://linux.dell.com/repo/hardware/omsa.html.
После того, как вы открыли управление, вы можете экспортировать журнал RAID-контроллера с помощью этой команды: omconfig storage controller action = exportlog controller = id, где контроллер - это идентификатор вашего контроллера (должен быть 0, если у вас не более одного контроллера RAID). Как только мы получим этот вывод, мы сможем подтвердить, что происходит. (с надеждой).
И последнее: ваш расширяемый RAID 5, знаете ли вы, PERC5i, SAS5 или другая модель?
Надеюсь на помощь!