Назад | Перейти на главную страницу

Связывание адаптера Ethernet в Ubuntu 10.04.

У меня есть несколько машин, на которых я строю кластер. Для повышения производительности мы решили использовать связывание на интерфейсах Ethernet (каждая ссылка составляет 1 Гигабайт). Я установил модуль ifenslave-2.6 для Ubuntu 10.04, а также настроил интерфейсы. Ниже представлена ​​моя конфигурация.

    # The loopback network interface
    auto lo
    iface lo inet loopback

    # The primary network interface
    auto eth0
    iface eth0 inet manual
    bond-master bond0

    auto eth1
    iface eth1 inet manual
    bond-master bond0

    auto bond0
    iface bond0 inet static
    address x.x.x.x
    gateway x.x.x.1
    netmask 255.255.255.0
    bond-mode 6
    bond-miimon 100
    bond-slaves none

Также пробовал подчиненные-подчиненные eth0 eth1 вместо bond-master bond0. Но ничего не сделал.

Итак, как вы можете видеть, я использую связь в режиме balance-alb или в режиме 6, чтобы включить связывание как для восходящего, так и для нисходящего потока. Часто (примерно четыре дня) мы видим, что машины не могут разговаривать друг с другом. Никаких пингов. Не отображается на nmap (nmap -sP x.x.x.x). Иногда некоторые машины видны, а некоторые нет. Все они клоны, но такое поведение странное. Сначала я проверил arp -a, чтобы узнать, есть ли у меня проблемы. И было много незавершенных записей. (Обычно происходит после сканирования nmap), но даже после того, как истекли таймауты и таблица успокоилась, у меня возникают проблемы с их проверкой связи.

Все они находятся в одной подсети. Нет брандмауэра. Все переходят к одному переключателю. Моя конфигурация переключателя проста и выглядит следующим образом

    interface GigabitEthernet1/1
    !
    interface GigabitEthernet1/2
    !
    interface GigabitEthernet1/3
    switchport mode access
    spanning-tree portfast
    !
    interface GigabitEthernet1/4
    switchport mode access
    spanning-tree portfast
    ! 
    interface GigabitEthernet1/5
    switchport mode access
    spanning-tree portfast
    .
    .
    .
    !
    interface GigabitEthernet1/17
    switchport mode access
    spanning-tree portfast
    !
    interface GigabitEthernet1/18
    switchport mode access
    spanning-tree portfast

Все они находятся в VLAN 1. Порт 1 идет к нашему роутеру. И порты 3-18 настроены одинаково. Их режим установлен на доступ, а связующее дерево установлено на portfast. Каждая машина использует две ссылки на этом переключателе. Коммутатор - это cisco 4948. Я отлично могу разговаривать с машинами из нашего шлюза или с машинами за пределами нашего шлюза. Но заставить их разговаривать внутри компании становится проблемой именно потому, что мы планируем использовать Hadoop. Любая помощь, подталкивание, мнение действительно были бы полезны! Спасибо.

Кроме того, добавление вывода ifenslave-2.6 -a.

    ifenslave.c:v1.1.0 (December 1, 2003)
    o Donald Becker (becker@cesdis.gsfc.nasa.gov).
    o Detach support added on 2000/10/02 by Willy Tarreau (willy at meta-x.org).
    o 2.4 kernel support added on 2001/02/16 by Chad N. Tindel
    (ctindel at ieee dot org).
    The result of SIOCGIFFLAGS on lo is 49.
    The result of SIOCGIFADDR is 00.00.7f.00.
    The result of SIOCGIFHWADDR is type 772  00:00:00:00:00:00.
    The result of SIOCGIFFLAGS on bond0 is 1443.
    The result of SIOCGIFADDR is 00.00.ffffff80.0a.
    The result of SIOCGIFHWADDR is type 1  00:1b:21:47:a0:c1.

Даже если это штраф, не могли бы вы дать мне знать? Тогда проблема может быть где-то в другом месте.

Мы используем LACP/802.3ad для наших связанных соединений по всей нашей сети; с наших серверов SAN (4xGigE + 2xGigE) <-> (2xGigE) на наши межкоммутаторные ссылки (смесь 2x и 4xGigE).

Вы получаете преимущества как агрегации пропускной способности, так и избыточности - и главное преимущество для меня - этим чертовски проще управлять, чем статическим агрегацией каналов.

Хотя я знаю, что он не дает прямого ответа на ваш вопрос, вы можете обнаружить, что он делает агрегацию ссылок намного более управляемой (или даже вообще работающей!).

-

Мое единственное другое предложение: подключите wirehark и посмотрите, что происходит через провод.