У меня закончились идеи по этой проблеме, поэтому подумал, что вопрос по научной фантастике может помочь.
У нас есть несколько серверов Ubuntu 9.10, которые мы недавно переключили с одиночных сетевых адаптеров на связанные сетевые адаптеры с использованием стандартного сетевого связывания ядра.
Эта установка работает, как планировалось (и как это делалось в прошлом для различных машин Linux), однако у нас были некоторые коробки, которые просто выпадали из сети через несколько часов после включения связывания.
Ящики буквально перестают отвечать в сети, однако простая /etc/init.d/networking restart через KVM возвращает соединение в оперативный режим.
Моя первая мысль была в том, что либо 1) восходящее соединение остановлено, 2) что-то локальное в коробке сдуло конфигурацию сети (например, network-manager), или 3) соединение каким-то образом сломалось.
Однако я быстро наткнулся на стену, пытаясь исследовать это на всех четырех серверах.
Событие не регистрируется локально ни на одном из серверов (/ var / log / *, dmesg и т. Д.). Я ожидал увидеть изменение статуса ссылки или подобное.
Восходящий поток переключает весь системный журнал централизованно, который также не фиксирует ни изменений в состоянии сети, ни переключения MAC.
/ proc / net / bonding / bond0 не сообщил о проблемах
Я не вижу ничего похожего на запущенный сетевой менеджер.
Единственное, что регистрируется, - это изменение состояния сети, вызванное перезапуском службы.
Первоначально мы использовали режим = 0 (активный-активный), но с предположением, что это вызывает путаницу в сети с MAC-адресами, присутствующими в двух местах, мы переключились на mode = 1 (активный-резервный) - это не имело значения, и серверы снова вышли из строя через несколько часов.
Как будто сеть просто «останавливается». Есть идеи, ребята?
/etc/modprobe.d/bonding.conf
alias bond0 bonding
options bonding mode=0 miimon=100
/ и т.д. / сеть / интерфейсы
auto bond0
iface bond0 inet static
address 192.168.1.10
gateway 192.168.1.1
netmask 255.255.255.0
slaves eth0 eth1
up /sbin/ifenslave bond0 eth0 eth1
down /sbin/ifenslave -d bond0 eth0 eth1
auto eth0
iface eth0 inet manual
auto eth1
iface eth1 inet manual
Вы предоставили очень мало информации для отладки.
Поскольку вы говорите "некоторые" работы.
В Ubuntu случались случайные сбои в сети с "плохими" ядрами в определенных конфигурациях даже без связывания. Попробуйте другое ядро, предполагая, что существующее ядро соответствует работающей системе.
В зависимости от используемого коммутатора и режима соединения даже сбой одного сетевого адаптера может привести к зависанию соединения. Попробуйте использовать двухканальный прозрачный мост с анализатором пакетов, чтобы определить последний использованный сетевой адаптер до отказа. Также посмотрите на последний тип пакета, флаги, повторные передачи и т. Д., Отправленные по сети до сбоя.
Лучшее предположение без информации - глючное ядро или неисправное оборудование. Ubuntu не будет лучшим выбором для серверной ОС. Ubuntu ориентирована на начинающих пользователей настольных Linux. Текущая версия Ubuntu предназначена для пользователей нетбуков. Ubu - хороший выбор для настольных ПК из-за его популярности - более крупные форумы, больше драйверов для оборудования для настольных ПК, больше настольных приложений. Debian и Centos / RHEL имеют более крупную базу установки для «критически важных» производственных задач для серверов Linux.