Назад | Перейти на главную страницу

Сетевая карта внезапно больше не отвечает, но отвечает после пинга

У нас проблема с сетевой картой на Dell Power Edge R410 с Debian 6 (сжатие). Похоже, сетевая карта через какое-то время перешла в "спящий" режим. Если мы подключаемся к серверу через ssh, соединение разрывается после определенного периода бездействия. Если затем мы пингуем сервер, он не отвечает на первые пакеты, но через 5-10 секунд отвечает снова.

Вот детали конфигурации:

ОПЕРАЦИОННЫЕ СИСТЕМЫ:

2.6.32-5-amd64 #1 SMP Wed May 18 23:13:22 UTC 2011 x86_64 GNU/Linux

Драйвер сетевой карты:

Broadcom Corporation NetXtreme II BCM5716 Gigabit Ethernet bnx2 v2.6.29-11:26
driver: bnx2
version: 2.0.2
firmware-version: 5.0.11 NCSI 2.0.5
bus-info: 0000:01:00.0

ОБНОВЛЕНИЕ: я не уверен, но, возможно, не только сетевая карта, но и весь сервер перешли в спящий режим. Я ничего не вижу в / var / log / messages, когда это происходит, если кто-то знает, как я могу увеличить уровень журнала, чтобы увидеть больше, дайте мне знать.

Я считаю, что проблема была вызвана описанной Вот

Вот решение вроде ответа:

Я еще не обновил ни один из наших боксов с версии 5.4, но должен сказать, что у меня были две большие проблемы со стандартными драйверами сетевой карты bnx2 версии 5.4 (как для R610, так и для R710). Первая проблема заключалась в том, что сетевые карты просто случайным образом умирали при большой нагрузке, что требовало перезапуска сети. Это, в частности, можно решить, добавив параметры bnx2 disable_msi=1 к /etc/modprobe.conf. После этого я обнаружил, что коробка, которая была в производстве, время от времени начинала периодически терять пакеты / подключение, что также требовало перезапуска сети. Я не мог решить эту проблему, не получив последние версии драйверов сетевой карты с веб-сайта Dell..

Теперь у меня нет никаких проблем, но я остановил автоматическое обновление ядра до тех пор, пока не настрою драйвер сетевой карты с помощью DKMS.

Непросто проверить, может ли проблема быть исправлена ​​в RHEL / CentOS 5.5, но я попробую.

Не эксперт ни в одном из Linux, но, возможно, это связано с настройками питания?

Большинство серверов / ОС имеют настройки для управления энергопотреблением, и они могут отключать или переводить в спящий режим некоторые аппаратные компоненты, если они бездействуют в течение некоторого времени. Возможно, сжатие настроено по умолчанию, чтобы позволить сетевой карте переходить в спящий режим, или, возможно, этот параметр настроен в BIOS сервера, и ОС просто не отменяет его.

Проверьте настройки в BIOS и ОС. В BIOS он должен быть под POWER.

Наконец я решил проблему. После обновления сетевого драйвера bnx2 до версии 2.0.23b проблема решена.

Вы должны проверить, на сервере ли проблема или в вашей сети.

Вы подключаетесь к этому серверу из той же IP-подсети, в которой он находится, или из другой?

Что вы увидите, если запустите сетевой сниффер (например, WireShark) на сервере после разрыва соединения, а затем попытаетесь пропинговать его с другого компьютера?