Назад | Перейти на главную страницу

Ubuntu 9.10 Network Bonding - умирает случайным образом

У меня закончились идеи по этой проблеме, поэтому подумал, что вопрос по научной фантастике может помочь.

У нас есть несколько серверов Ubuntu 9.10, которые мы недавно переключили с одиночных сетевых адаптеров на связанные сетевые адаптеры с использованием стандартного сетевого связывания ядра.

Эта установка работает, как планировалось (и как это делалось в прошлом для различных машин Linux), однако у нас были некоторые коробки, которые просто выпадали из сети через несколько часов после включения связывания.

Ящики буквально перестают отвечать в сети, однако простая /etc/init.d/networking restart через KVM возвращает соединение в оперативный режим.

Моя первая мысль была в том, что либо 1) восходящее соединение остановлено, 2) что-то локальное в коробке сдуло конфигурацию сети (например, network-manager), или 3) соединение каким-то образом сломалось.

Однако я быстро наткнулся на стену, пытаясь исследовать это на всех четырех серверах.

Единственное, что регистрируется, - это изменение состояния сети, вызванное перезапуском службы.

Первоначально мы использовали режим = 0 (активный-активный), но с предположением, что это вызывает путаницу в сети с MAC-адресами, присутствующими в двух местах, мы переключились на mode = 1 (активный-резервный) - это не имело значения, и серверы снова вышли из строя через несколько часов.

Как будто сеть просто «останавливается». Есть идеи, ребята?

Конфигурация

/etc/modprobe.d/bonding.conf

alias bond0 bonding
options bonding mode=0 miimon=100

/ и т.д. / сеть / интерфейсы

auto bond0
iface bond0 inet static
address 192.168.1.10
gateway 192.168.1.1
netmask 255.255.255.0
slaves eth0 eth1
up /sbin/ifenslave bond0 eth0 eth1
down /sbin/ifenslave -d bond0 eth0 eth1

auto eth0
iface eth0 inet manual

auto eth1
iface eth1 inet manual

Вы предоставили очень мало информации для отладки.

  • Какой переключатель вы используете?
  • Какие сетевые карты вы используете?
  • Какое ядро ​​вы используете?
  • Вы следовали документации Ubuntu и удалили сетевой менеджер? https://help.ubuntu.com/community/LinkAggregation

Поскольку вы говорите "некоторые" работы.

  • Вы проверили различия в конфигурации?
  • Сбои случаются только на определенных портах коммутатора?
  • Имеют ли работающие системы одинаковое оборудование, ядро, сетевую карту, конфигурацию и т. Д.?
  • Можете ли вы "заставить" ошибку? Попробуйте тяжелую нагрузку, большие пакеты, плохие пакеты и т. Д., Чтобы попытаться вызвать ошибку по запросу.

В Ubuntu случались случайные сбои в сети с "плохими" ядрами в определенных конфигурациях даже без связывания. Попробуйте другое ядро, предполагая, что существующее ядро ​​соответствует работающей системе.

В зависимости от используемого коммутатора и режима соединения даже сбой одного сетевого адаптера может привести к зависанию соединения. Попробуйте использовать двухканальный прозрачный мост с анализатором пакетов, чтобы определить последний использованный сетевой адаптер до отказа. Также посмотрите на последний тип пакета, флаги, повторные передачи и т. Д., Отправленные по сети до сбоя.

Лучшее предположение без информации - глючное ядро ​​или неисправное оборудование. Ubuntu не будет лучшим выбором для серверной ОС. Ubuntu ориентирована на начинающих пользователей настольных Linux. Текущая версия Ubuntu предназначена для пользователей нетбуков. Ubu - хороший выбор для настольных ПК из-за его популярности - более крупные форумы, больше драйверов для оборудования для настольных ПК, больше настольных приложений. Debian и Centos / RHEL имеют более крупную базу установки для «критически важных» производственных задач для серверов Linux.