Назад | Перейти на главную страницу

Связанные интерфейсы Linux периодически зависают

У меня несколько хостов, которые показывают проблемы с подключением. Например, при работе из командной строки набор текста останавливается на секунду или около того, затем восстанавливается, а затем снова.

Самый вопиющий пример хоста зависает (ввод) на 15-30 секунд, затем восстанавливается и выходит из строя через 5 секунд. Переключение кабелей ничего не дало, но удаление одного из физических кабелей привело к тому, что все сразу очистилось (поэтому я думаю, что это проблема сети).

Глядя на сеть, я не видел плавающих пакетов, которые могли бы это объяснить.

Эти интерфейсы Ethernet (Gigabit Dell) мы раньше работала нормально, но поскольку мы переместили системы - и поместите их на новый набор переключателей - это было проблемой на нескольких теоретически идентично настроенных хостах.

Первыми коммутаторами были HP Procurve 1810-24G и HP Procurve 1800-24G, подключенные через LLDP; новые коммутаторы - это оба Cisco SG 200-26, которые, как я понимаю, являются коммутаторами Linksys с измененным брендом.

Это вызвано проблемой с переключателями? Это конфигурация коммутатора? Коммутаторы Cisco не способны справиться с этим?

Я не вижу, где находится конфигурация; Я искал обычный /etc/sysconfig/network/devices но там нет ничего о параметрах (вроде опроса mii) и ничего о методе их балансировки. Ищу скрипты, ничего не могу найти в /etc/init.d/network либо.

В качестве хостов используются почти все системы Red Hat Enterprise Linux 5.x (5.6, 5.7), но некоторые из них - Ubuntu Server 10.04.3 Lucid Lynx. Мне нужна помощь с обоими, если до этого дойдет.

ОБНОВИТЬ: Мы также наблюдаем некоторые проблемы с серверами на исходных коммутаторах.

Коммутаторы HP и коммутаторы Cisco также связаны (временно); от одного переключателя к другому идет кабель. Пинги на любом из этих хостов показывают примерно один ICMP-пакет из каждых 5-6 сброшенных (истекло время). Могло ли быть взаимодействие между двумя переключателями?

Да, и хосты используют соединение с Balance-RR в качестве метода.

ОБНОВИТЬ: Один из коммутаторов Cisco использует протокол обнаружения Cisco (CDP), и наш хост VMware 4 ESXi принимает это, даже если этот сервер ESXi подключен к коммутатору HP.

ОБНОВИТЬ: Я обновил коммутаторы Cisco и отключил CDP, LLDP-MED и STP - коммутаторы HP не поддерживают CDP или STP, и, похоже, они не поддерживают LLDP-MED. Так что все отключено. Это устранило проблемы на хостах в нашей старой сети, подключенных к HP, но хосты на другой стороне по-прежнему показывают неприемлемую скорость потерянных пакетов - но только некоторые хосты.

Хосты без связанных интерфейсов не показывают проблем. Один или два таких хоста вообще не имеют связанных интерфейсов; у одного есть связанный интерфейс, но один порт отключен.

Что будет, если я сниму подчиненный интерфейс вручную? Как с этим справляется связанный интерфейс?

ОБНОВИТЬ: При тестировании кажется, что отключение функционального подчиненного интерфейса Ethernet не убивает все (как и должно быть). Выполнение этого на выбранных хостах (но не на всех) устранило проблему; по какой-то причине при подключении к определенным хостам отбрасывалось большое количество пакетов, а в других системах эта проблема не возникала. Связанные интерфейсы трех хостов были сокращены до одного порта Ethernet, и теперь отброшенные пакеты больше нигде не кажутся проблемой.

Конечно, это не так решить проблема - он просто заставил его уйти (что сейчас является проблемой номер один). Следующим шагом будет проверка физической кабельной разводки в следующий раз, когда я пойду в центр обработки данных - двойные порты должны быть в отдельных коммутаторах, но являются Oни? Буду проверять.

Вот ссылка для RHEL6

http://docs.redhat.com/docs/en-US/Red_Hat_Enterprise_Linux/6/html/Deployment_Guide/sec-Using_Channel_Bonding.html

RHEL5

http://docs.redhat.com/docs/en-US/Red_Hat_Enterprise_Linux/5/html/Deployment_Guide/s2-networkscripts-interfaces-chan.html

Как сказал Джон, для использования режима 4 на ваших коммутаторах должны быть включены протоколы 802.3ad или LACP. Вы можете использовать режим 2 (активное резервное копирование) для тестирования или режим 6 (адаптивная балансировка нагрузки) в будущем.

Вот ссылка на связующий материал Ubuntu: https://help.ubuntu.com/community/UbuntuBonding

Что касается их в целом, это зависит от того, какой режим склеивания вы используете. Если используется режим 4, необходимо настроить коммутатор для cisco, обычно он настраивает LACP. Не уверен в тех моделях, которые у вас есть.

Другие режимы связывания не требуют каких-либо специальных конфигураций коммутатора, и, как правило, это зависит от того, какой режим вы выберете - от того, хотите ли вы использовать резервирование в качестве первичной, входящей или исходящей балансировки нагрузки.