Проблема
Все производственные серверы внезапно лишились доступа к Интернету, в то время как четыре других сервера, подключенных к той же VLAN и с такими же настройками eth0, могли.
Фигура 1: System 1
представляет четыре системы, которые могут получить доступ к Интернету, а System 2
указывает те, которые внезапно не могут с сегодняшнего дня.
Анализ
Default Gateway
(10.10.10.1) также можно отправлять эхо-запросы из Системы 1 и Системы 2eth0
конфигурация идентична между всеми производственными серверами/etc/resolve.conf
можно получить доступDefault Gateway
em1
адаптер вместо eth0
sudo arping -I eth0 ping.tweakers.net
работает на всех 8 системахsudo iptables-save
был выполненroute -n
идентична между всеми системамиTracepath
[username@hostname ~]$ tracepath google.com
1: 10.10.10.10 (10.10.10.10) 0.222ms pmtu 1500
1: 10.10.10.1 (10.10.10.1) 0.662ms
1: 10.10.10.1 (10.10.10.1) 0.601ms
2: no reply
ARP
Система1: ? (10.10.10.1) at AA:BB:CC:DD:EE:FF [ether] on em1
System2: ? (10.10.10.1) at AA:BB:CC:DD:EE:FF [ether] on eth0
Выведите iptables-save на одной из систем, у которой нет доступа к Интернету.
# Generated by iptables-save vX on Fri Aug 1 10:00:01 2014
*filter
:INPUT ACCEPT [X:Y]
:FORWARD ACCEPT [0:0]
:OUTPUT ACCEPT [X:Y]
COMMIT
# Completed on Fri Aug 1 10:00:01 2014
маршрут -n
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
10.10.10.0 0.0.0.0 255.255.255.0 U 0 0 0 eth0
X.Y.0.0 0.0.0.0 255.255.0.0 U Z 0 0 eth0
0.0.0.0 10.10.10.1 0.0.0.0 UG 0 0 0 eth0
Непонятно, почему с четырех производственных серверов больше нельзя получить доступ в Интернет. Поскольку они работают в производственной среде, перезапуск сети следует предотвратить. Какие дальнейшие тесты можно провести для исследования проблемы?