Мы используем контроллер интеллектуального массива P410 от HP на нашем сервере supermicro.
К сожалению, жесткие диски в массиве RAID10 были повреждены, и мы были вынуждены заменить этот жесткий диск. После 3 дней и двух перезагрузок сервера мы все еще видим самое первое предупреждающее сообщение после замены жесткого диска, в котором говорится:
Предупреждающие сообщения о состоянии ((готов к восстановлению) логический диск 1 (931,5 ГБ, RAID 1 + 0)) 776 (готов к восстановлению) логический диск 1 (931,5 ГБ, RAID 1 + 0) поставлен в очередь на восстановление.
Нас беспокоит эта проблема, и мы решили проверить обновление прошивки, и, надеюсь, оно актуально и для него нет доступных обновлений.
Примечательно, что мы поменяли RAID CARD на новую с той же моделью. информация о нашем рейдовом устройстве:
Firmware Version 6.40
Number of Ports 2 (Internal only)
Number of Arrays 3
Smart Array P410 in Slot 1
Bus Interface: PCI
Slot: 1
Serial Number: PACCR9SXRCQH
Cache Serial Number: PAAVPID12031NLH
RAID 6 (ADG) Status: Disabled
Controller Status: OK
Hardware Revision: C
Firmware Version: 6.40
Rebuild Priority: Medium
Expand Priority: Medium
Surface Scan Delay: Not Available
Surface Scan Mode: High
Queue Depth: Automatic
Monitor and Performance Delay: 60 min
Elevator Sort: Enabled
Degraded Performance Optimization: Disabled
Inconsistency Repair Policy: Disabled
Wait for Cache Room: Disabled
Surface Analysis Inconsistency Notification: Disabled
Post Prompt Timeout: 15 secs
Cache Board Present: True
Cache Status: OK
Cache Ratio: 25% Read / 75% Write
Drive Write Cache: Enabled
Total Cache Size: 512 MB
Total Cache Memory Available: 400 MB
No-Battery Write Cache: Disabled
Cache Backup Power Source: Batteries
Battery/Capacitor Count: 1
Battery/Capacitor Status: OK
SATA NCQ Supported: True
Мы также запустили DIAGNOSTIC REPORT Wizard, и это отчет нашего устройства:
https://www.dropbox.com/s/vy6bo07xaraea1a/report-7c62988a-00000874-00000000.zip
Это очень неприятная ситуация, сервер работает, но один из жестких дисков массива RAID10 не восстановлен и не присоединен к массиву RAID 10.
Что делать и как решить проблему?
Это также результат этой команды в командной строке HP: ctrl all show config detail
https://www.dropbox.com/s/zpadsxcx1emqlvi/ConfigurationsRAID.txt
Наилучшие пожелания
Я решил проблему, заменив эти 3 жестких диска, если я столкнулся с проблемой, я последую вашему недавнему совету.
После замены жестких дисков я загрузил сервер с помощью компакт-диска BIOSUPDATE RAID CONTROLLER. Я удалил этот логический диск, воссоздал его и восстановил сервер с помощью BARE METAL BACKUP.
Кажется, все в порядке, и я не вижу ошибок и предупреждений в УТИЛИТЕ КОНФИГУРАЦИИ ARRAY.
Но я вижу что-то ненормальное. В ACU, когда я нажимаю на дополнительную информацию для этого вновь созданного логического диска, появляется раздел, в котором описаны разделы этого диска, и я вижу эту подозрительную строку: Номер раздела: 1, Размер: 100 МБ, Точка монтирования: Неизвестно
Точка монтирования - диск C, но почему это неизвестно для RAID? Сервер загружается нормально.
Думаю, это нужно исправить. Вы что-нибудь об этом знаете?
Читая вашу конфигурацию, вижу:
Всего 8 дисков ...
Я не буду спрашивать, почему у тебя два Массивы RAID 0. Удивительно, но они здоровы!
Похоже, заменили диск 2. Он сопряжен с диском 4. Скорее всего, на диске 4 могут быть ошибки READ, препятствующие восстановлению диска 2. Это базовые диски SATA емкостью 500 ГБ, и все диски имеют ряд Автобус ошибки. На самом деле я не вижу явных счетчиков ошибок чтения / записи на отдельных дисках ...
На самом деле у вас может просто возникнуть проблема с объединительной платой диска Supermicro.
Диски 1,2,3 имеют Write Retries Failed (0x2b)
как «Причину последней неудачи»
Если вы хотите подробнее ознакомиться с отчетом о диагностике массива, пожалуйста, см. это руководство.