Назад | Перейти на главную страницу

Infiniband: ibping работает, но интерфейса ib0 нет

(перенаправлено сюда из NetworkEngineering)

У меня есть несколько серверов, подключенных к Infiniband, которые сообщают, что их сетевое соединение ib0 пропало из ip и ifcfg в течение нескольких часов друг от друга. Я попытался перезагрузить один из серверов, но безуспешно, снова все произошло точно так же.

ibstat и ibstatus показывают, что карта IB активна, и я могу использовать ibping для доступа к узлам без интерфейса ib0, но сеть ib непригодна (и, по-видимому, не видна). Я проверил lsmod на наличие всех записей, связанных с ib_, и они выглядели нормально.

Интересно, что я нашел это в dmesg, но, к сожалению, не смог найти в сети ничего, что могло бы соответствовать этой проблеме:

Mellanox Connect-IB Infiniband driver v4.7-1.0.0
Request for unknown module key 'Mellanox Technologies signing key:  err -11
mlx5_0: ipoib_transport_dev_init failed
ib0 failed to init HW resource
mlx5_0: failed to initialize device: ib0 port 1 (ret = -12)
mlx5_0: couldn't register ipoib port 1; error -12```