Назад | Перейти на главную страницу

CentOS 8, RAID-контроллер Dell PERC H330, без блочного устройства (большую часть времени)

Недавно мы купили новый сервер Dell R340XL и установили CentOS 8. У нас есть один SSD для загрузки на контроллере BOSS (как sda) и 4 HDDS на PERC H330 в RAID 5 (как sdb). Несколько дней он работал нормально, а два дня назад мы больше не могли видеть том RAID. Мы связались с Dell по телефону, и они помогли нам обновить прошивки на нескольких устройствах, но мы все еще не видим том RAID. Любая помощь приветствуется.

Устройство появляется, когда я делаю lspci:

02:00.0 RAID bus controller: Broadcom / LSI MegaRAID SAS-3 3008 [Fury] (rev 02)
        Subsystem: Dell PERC H330 Adapter
...
        Kernel driver in use: megaraid_sas
        Kernel modules: megaraid_sas

Я загрузил MegaCli и могу получать любую информацию. Команда MegaCli64 -LdGetNum -aAll говорит мне это:

Number of Virtual Drives Configured on Adapter 0: 1

Если мы перезагружаем сервер снова и снова, время от времени мы увидим, что массив RAID отображается как блочное устройство, но отображается как sda, что делает загрузочный диск sdb.

Я просмотрел журналы dmesg и системные журналы, и я не так много знаю, как распознать, но я действительно вижу такие вещи:

[    1.296976] megasas: 07.707.51.00-rc1
[    1.301092] megaraid_sas 0000:02:00.0: FW now in Ready state
[    1.301095] megaraid_sas 0000:02:00.0: 63 bit DMA mask and 32 bit consistent mask
[    1.301363] megaraid_sas 0000:02:00.0: firmware supports msix        : (96)
[    1.301364] megaraid_sas 0000:02:00.0: current msix/online cpus      : (12/12)
[    1.301365] megaraid_sas 0000:02:00.0: RDPQ mode     : (disabled)
[    1.301366] megaraid_sas 0000:02:00.0: Current firmware supports maximum commands: 928        LDIO threshold: 237
[    1.301477] megaraid_sas 0000:02:00.0: Configured max firmware commands: 927
[    1.303185] megaraid_sas 0000:02:00.0: FW supports sync cache        : No

...

[    1.680004] megaraid_sas 0000:02:00.0: FW provided supportMaxExtLDs: 0       max_lds: 32
[    1.680005] megaraid_sas 0000:02:00.0: controller type       : iMR(0MB)
[    1.680005] megaraid_sas 0000:02:00.0: Online Controller Reset(OCR)  : Enabled
[    1.680006] megaraid_sas 0000:02:00.0: Secure JBOD support   : No
[    1.680006] megaraid_sas 0000:02:00.0: NVMe passthru support : No
[    1.680007] megaraid_sas 0000:02:00.0: FW provided TM TaskAbort/Reset timeout        : 0 secs/0 secs
[    1.702120] megaraid_sas 0000:02:00.0: INIT adapter done
[    1.702121] megaraid_sas 0000:02:00.0: Jbod map is not supported megasas_setup_jbod_map 5371
[    1.728949] megaraid_sas 0000:02:00.0: pci id                : (0x1000)/(0x005f)/(0x1028)/(0x1f44)
[    1.728950] megaraid_sas 0000:02:00.0: unevenspan support    : yes
[    1.728950] megaraid_sas 0000:02:00.0: firmware crash dump   : no
[    1.728951] megaraid_sas 0000:02:00.0: jbod sync map         : no
[    1.729017] scsi host0: Avago SAS based MegaRAID driver
[    1.730804] scsi 11:0:0:0: Processor         Marvell  Console          1.01 PQ: 0 ANSI: 5
[    1.732057] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732076] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732094] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732112] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732131] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732149] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732167] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732185] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732206] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732224] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732242] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured

Этот сбой распределения выглядит тревожным, но когда я попытался погуглить, я не нашел много. Один человек пытался создать более 200 логических устройств, но мы определенно не делаем этого здесь.

Заранее спасибо.

Дважды проверьте, что это H330, а не HBA330; и если это действительно H330, убедитесь, что кто-то случайно не переключил его в режим HBA / passthrough. Надеюсь, это что-то простое, но я предполагаю, что это еще не все.