Назад | Перейти на главную страницу

Потеряны SCSI-блочные устройства Fibre Channel-SAN

В FC-SAN есть 3 LUN, к которым я хочу получить доступ, используя 2 HBA (с двумя путями на каждый. Когда система загружается, все кажется хорошо, но через некоторое время sd * -устройства со второго HBA исчезли, и у меня нет Идея, почему или как вернуть их без перезагрузки.Сканирование SCSI-шины по-прежнему находит все устройства, но ядро ​​не распознает блочные устройства.Это Red Hat 6.6 с последними обновлениями.

Такие же LUN ​​доступны на 4 путях в другой системе, но только на 2 в этой.

Кто-нибудь знает, что мне может не хватать?

# lspci|grep Fibre
08:00.0 Fibre Channel: QLogic Corp. ISP2532-based 8Gb Fibre Channel to PCI Express HBA (rev 02)
08:00.1 Fibre Channel: QLogic Corp. ISP2532-based 8Gb Fibre Channel to PCI Express HBA (rev 02)


# lsscsi
...
[1:0:0:1]    disk    DataCore Virtual Disk     DCS   /dev/sdb
[1:0:0:2]    disk    DataCore Virtual Disk     DCS   /dev/sdc
[1:0:0:3]    disk    DataCore Virtual Disk     DCS   /dev/sdd
[1:0:1:1]    disk    DataCore Virtual Disk     DCS   /dev/sde
[1:0:1:2]    disk    DataCore Virtual Disk     DCS   /dev/sdf
[1:0:1:3]    disk    DataCore Virtual Disk     DCS   /dev/sdg
[2:0:0:1]    disk    DataCore Virtual Disk     DCS   -
[2:0:0:2]    disk    DataCore Virtual Disk     DCS   -
[2:0:0:3]    disk    DataCore Virtual Disk     DCS   -
[2:0:1:1]    disk    DataCore Virtual Disk     DCS   -
[2:0:1:2]    disk    DataCore Virtual Disk     DCS   -
[2:0:1:3]    disk    DataCore Virtual Disk     DCS   -
...
# rescan-scsi-bus.sh
...
0 new or changed device(s) found.
0 remapped or resized device(s) found.
0 device(s) removed.

Это было зарегистрировано, когда это произошло:

May 24 12:08:57 hostname  kernel: sd 1:0:0:1: Parameters changed
May 24 12:08:57 hostname  kernel: sd 1:0:1:3: Parameters changed
May 24 12:09:01 hostname  kernel: sd 1:0:1:2: Parameters changed
May 24 12:09:24 hostname  kernel: sd 1:0:1:1: Parameters changed
May 24 12:09:24 hostname  kernel: sd 2:0:0:1: rejecting I/O to offline device
May 24 12:09:25 hostname  multipathd: checker failed path 8:112 in map lun0
May 24 12:09:25 hostname  multipathd: ora_data2: remaining active paths: 3
May 24 12:09:25 hostname  multipathd: checker failed path 8:128 in map lun1
May 24 12:09:25 hostname  multipathd: ora_acfs1: remaining active paths: 3
May 24 12:09:25 hostname  multipathd: checker failed path 8:144 in map lun2
May 24 12:09:25 hostname  multipathd: ora_acfs2: remaining active paths: 3
May 24 12:09:25 hostname  multipathd: checker failed path 8:160 in map lun0
May 24 12:09:25 hostname  multipathd: ora_data2: remaining active paths: 2
May 24 12:09:25 hostname  multipathd: checker failed path 8:176 in map lun1
May 24 12:09:25 hostname  multipathd: ora_acfs1: remaining active paths: 2
May 24 12:09:25 hostname  multipathd: checker failed path 8:192 in map lun2
May 24 12:09:25 hostname  multipathd: ora_acfs2: remaining active paths: 2
May 24 12:09:25 hostname  kernel: device-mapper: multipath: Failing path 8:112.
May 24 12:09:25 hostname  kernel: device-mapper: multipath: Failing path 8:128.
May 24 12:09:25 hostname  kernel: device-mapper: multipath: Failing path 8:144.
May 24 12:09:25 hostname  kernel: device-mapper: multipath: Failing path 8:160.
May 24 12:09:25 hostname  kernel: device-mapper: multipath: Failing path 8:176.
May 24 12:09:25 hostname  kernel: device-mapper: multipath: Failing path 8:192.

К сожалению, у меня нет доступа к SAN-устройству, но мне сказали, что ничего не трогали.

Я только что видел, что устройства на самом деле пропали, но вернулись через 2 часа:

May 24 14:06:35 hostname kernel: scsi 2:0:1:1: Attached scsi generic sg9 type 0
May 24 14:06:35 hostname kernel: scsi 2:0:1:2: Attached scsi generic sg10 type 0
May 24 14:06:35 hostname kernel: scsi 2:0:1:3: Attached scsi generic sg11 type 0
May 24 14:06:37 hostname kernel: scsi 2:0:0:1: Attached scsi generic sg12 type 0
May 24 14:06:37 hostname kernel: scsi 2:0:0:2: Attached scsi generic sg13 type 0
May 24 14:06:37 hostname kernel: scsi 2:0:0:3: Attached scsi generic sg14 type 0

Возможно, что промежуточный FC-переключатель в это время был отключен. Когда система загружалась ранее и sd-устройства создавались как обычно, строка немного отличается:

May 24 11:14:15 hostname kernel: sd 2:0:1:3: Attached scsi generic sg14 type 0

vs.

May 24 14:06:35 hostname kernel: scsi 2:0:1:1: Attached scsi generic sg9 type 0

Вместо sd написано "scsi".