Назад | Перейти на главную страницу

потеря связи в Linux с блейд-серверами Dell и т.п.

Итак, у нас есть несколько блейд-серверов Dell и шасси (блейд-серверы M600, шасси M1000) и другие системы (R710 с массивом MD3000). R710 экспортирует дерево исходных текстов через nfs для создания и тестирования лезвий.

Проблема в том, что лезвия ослабляют крепления nfs. У блейд-серверов в одном корпусе, кажущихся идентичными конфигурациями, зависают соединения, они даже не могут пинговать сервер. В конце концов они возвращаются.

В основном это Dell, на самом деле у нас есть кабель, идущий от r710 к коммутатору в одном из шасси, а другой - к коммутатору, а оттуда к шасси, у обоих могут быть проблемы.

Мы используем Centos5 или Fedora Core версии 5 (Bordeaux). Сервер nfs работает под управлением CentOS версии 5.4 (Final).

Есть предположения? советы по устранению неполадок?

Все это на один и тот же хост, но по разным маршрутам:

Через переключатель

[root@b053 ~]# ping svnwatch-data
PING storage.rack1.rinera.int (10.1.1.54) 56(84) bytes of data.

--- storage.rack1.rinera.int ping statistics ---
9 packets transmitted, 0 received, 100% packet loss, time 7999ms

Маршрутизировано через другой хост:

[root@b053 ~]# ping svnwatch-data2
PING storage2.rack1.rinera.int (172.16.100.25) 56(84) bytes of data.
64 bytes from 172.16.100.25: icmp_seq=1 ttl=64 time=0.260 ms
64 bytes from 172.16.100.25: icmp_seq=2 ttl=64 time=0.217 ms
64 bytes from 172.16.100.25: icmp_seq=3 ttl=64 time=0.201 ms
64 bytes from 172.16.100.25: icmp_seq=4 ttl=64 time=0.264 ms

--- storage2.rack1.rinera.int ping statistics ---
4 packets transmitted, 4 received, 0% packet loss, time 2999ms
rtt min/avg/max/mdev = 0.201/0.235/0.264/0.031 ms

Когда хост подключен к коммутатору другого шасси (они подключены гирляндой)

[root@b053 ~]# ping svnwatch-data-eth2
PING svnwatch-data-eth2.rack1.rinera.int (10.1.1.56) 56(84) bytes of data.
64 bytes from 10.1.1.56: icmp_seq=1 ttl=64 time=0.598 ms
64 bytes from 10.1.1.56: icmp_seq=2 ttl=64 time=0.096 ms
64 bytes from 10.1.1.56: icmp_seq=3 ttl=64 time=0.168 ms

--- svnwatch-data-eth2.rack1.rinera.int ping statistics ---
3 packets transmitted, 3 received, 0% packet loss, time 2000ms
rtt min/avg/max/mdev = 0.096/0.287/0.598/0.222 ms
[root@b053 ~]#

Вот что я бы проверил.

  • таблицы маршрутов: ip route show
  • кеш маршрута: ip route show cache
  • проверьте наличие каких-либо странных правил iptables. iptables -t nat -L -n -v; iptables -L -n -v; iptables -t mangle -L -n -v
  • проверьте файлы журнала.
  • проверить версию ядра.
  • проверьте настройки sysctl / proc, такие как rp_filter, что важно для маршрутизируемой / мультиинтерфейсной конфигурации
  • проверьте таблицы ARP на наличие конфликтов IP и т. д.
  • и конечно: tcpdump и tcpflow ...