Назад | Перейти на главную страницу

Сетевой интерфейс периодически выходит из строя со скоростью, измененной на 0 ошибок ядра

За последние пару дней связанный сетевой интерфейс на одном из наших серверов перестал отвечать.

Просматривая журналы ядра, я замечаю, что когда интерфейс выходит из строя, мы получаем множество повторяющихся ошибок вида:

[76019.645601] e1000e 0000:03:00.0 p9p1: speed changed to 0 for port p9p1
[76325.575540] e1000e 0000:03:00.0 p10p1: speed changed to 0 for port p10p1

Проведя быстрый поиск похожих проблем, я не смог найти никого, кто раньше сообщал бы о подобном поведении.

Чтобы предоставить еще несколько подробностей о конфигурации сервера:

Мне было интересно, испытывал ли кто-нибудь подобные проблемы раньше и есть ли какие-либо предложения по отладке причины чего-то вроде этого?

Похоже, что для меня эти проблемы, вероятно, были вызваны известной ошибкой в ​​ядре Linux v4.4.0-97-generic в Ubuntu 16.04: e1000e в 4.4.0-97-generic ломает 82574L при большой нагрузке.

После применения исправленного тестовая версия ядра v4.4.0-98, отправленный правопреемником ошибки, в трекере ошибок пакета Ubuntu Linux с тех пор я не сталкивался с ошибочным поведением, возвращающимся после уик-энда довольно тяжелого нагрузочного тестирования связанного интерфейса.