У машины Solaris 11 со старым Emulex HBA, похоже, есть некоторые проблемы:
# dmesg | egrep emlxs
Dec 29 15:31:10 san2 emlxs: [ID 349649 kern.info] [ 5.0608]emlxs1: NOTICE: 730: Link reset. (Disabling link...)
Dec 29 15:31:10 san2 emlxs: [ID 349649 kern.info] [ 5.0333]emlxs1: NOTICE: 710: Link down.
Dec 29 15:31:11 san2 emlxs: [ID 349649 kern.info] [ B.1FD3]emlxs1: NOTICE: 930: Packet transport failed. (*Node not found. did=10300)
Когда я пытаюсь сбросить затронутый адаптер с помощью emlxadm (это карта с двойным HBA PCI-X), он выдает ошибки и не сбрасывается:
# /opt/EMLXemlxu/bin/emlxadm
Available Emulex HBA's:
1. FCT:emlxs0 : /devices/pci@0,0/pci8086,25e2@2/pci8086,350c@0,3/pci1014,1a7@1/pci10df,f980@4 (CONNECTED)
2. FCT:emlxs1 : /devices/pci@0,0/pci8086,25e2@2/pci8086,350c@0,3/pci1014,1a7@1/pci10df,f980@5 (NOT CONNECTED)
Enter an HBA number or zero to exit: 2
HBA 2: /devices/pci@0,0/pci8086,25e2@2/pci8086,350c@0,3/pci1014,1a7@1/pci10df,f980@5
emlxadm> get_fw_rev
Firmware revision: LP9802DC 1.92a1
emlxadm> reset_hard
ioctl: FCIO_RESET_HARD: Device busy
fcio: FCIO_RESET_HARD: Operation successful.
> exit
# fcadm force-lip 10000000c93a3e6b
Error: Failed to reinitialize the link of HBA 10000000c93a3e6b
fmdump
ошибок не зарегистрировано. Кажется, что перезагрузка решает проблему, и она возникает нечасто. HBA подключен к Brocade Silkworm с версией FabricOS 5.30.
Обновления: Прошивка самая последняя / самая лучшая, версия драйвера - 2.60f.
Я попытался сбросить настройки порта и даже выключил и снова включил Silkworm, но порт остается в автономном состоянии, по-видимому, потому, что Emulex HBA отключил GBIC PHY:
SW3014BC2_B:admin> portshow 13
portName:
portHealth: No Fabric Watch License
Authentication: None
portDisableReason: None
portCFlags: 0x1
portFlags: 0x4001 PRESENT U_PORT LED
portType: 4.2
portState: 2 Offline
portPhys: 4 No_Light
Есть идеи о возможных причинах или о том, как восстановить соединение без перезагрузки?
Этот порт HBA подключен к целевому порту, просто отключите его на мгновение, сбросьте его, а затем снова подключите. Не знаю, какой для вас самый простой способ сделать это, поскольку я не знаю вашего дизайна SAN, но я думаю, что отключение порта на вашем коммутаторе может быть самым простым / быстрым способом.
В конце концов, я заменил HBA, так как проблема казалась мне «аппаратной» ближе к концу.