Назад | Перейти на главную страницу

Сервер недоступен, лучший способ выяснить причину?

Я запускаю debian squeeze на арендованном выделенном сервере, и в последнее время сервер становится все чаще недоступным из одного момента в другой с какой-либо внешней службой.

Во время этого простоя crontabs и т. Д. Работают нормально, и я не смог найти ни одного сообщения о сбое или связанных с ним файлов журналов.

Чтобы вернуть управление, я просто перезапускаю его через веб-интерфейс моего провайдера.

По поводу этой темы: Сбой сети Linux: какие шаги нужно предпринять, чтобы выяснить причину? Я столкнулся с этой проблемой у своего провайдера, но они не смогли найти никаких проблем с их сетевым адаптером или сетевой картой, кроме того, они полностью изменили мое серверное оборудование (кроме жесткого диска).

Как я могу приблизиться к источнику, вызвавшему эти простои?

К сожалению, у меня нет доступа к серверу, когда он недоступен извне, чтобы провести какие-либо тесты.

Пока сервер недоступен, "arp -na" возвращает "at <неполный> at на eth0". (Я сделал просто crontab, который проверяет это состояние) В системном журнале я не могу найти никакой информации, связанной с этой проблемой.

puck:/home# route -n
Kernel-IP-Routentabelle
Ziel            Router          Genmask         Flags Metric Ref    Use Iface
xx.xx.xxx.xxx   0.0.0.0         255.255.255.192 U     0      0        0 eth0
0.0.0.0         xx.xx.xxx.xxx   0.0.0.0         UG    0      0        0 eth0

puck:/home# arp -na
? (xx.xx.xxx.xxx) auf 00:00:5e:00:01:01 [ether] auf eth0

puck:/home# ethtool eth0
Settings for eth0:
        Supported ports: [ TP MII ]
        Supported link modes:   10baseT/Half 10baseT/Full
                                100baseT/Half 100baseT/Full
                                1000baseT/Half 1000baseT/Full
        Supports auto-negotiation: Yes
        Advertised link modes:  10baseT/Half 10baseT/Full
                                100baseT/Half 100baseT/Full
                                1000baseT/Half 1000baseT/Full
        Advertised pause frame use: Symmetric Receive-only
        Advertised auto-negotiation: Yes
        Speed: 100Mb/s
        Duplex: Full
        Port: MII
        PHYAD: 1
        Transceiver: external
        Auto-negotiation: on
        Supports Wake-on: g
        Wake-on: g
        Current message level: 0x000000ff (255)
        Link detected: yes

Мои интерфейсы:

auto lo
iface lo inet loopback

# ethernet interface

auto eth0
iface eth0 inet static
  address xxx.xxx.xxx.xxx
  network xxx.xxx.xxx.yyy
  netmask 255.255.255.yyy
  broadcast xxx.xxx.xxx.255
  gateway xxx.xxx.zzz.zzz

# virtual interfaces

auto eth0:1
iface eth0:1 inet static
address xxx.xxx.xxx.xxx
netmask 255.255.255.255

auto eth0:2
iface eth0:2 inet static
address xxx.xxx.xxx.xxx
netmask 255.255.255.255


auto eth0:3
iface eth0:3 inet static
address xxx.xxx.xxx.xxx
netmask 255.255.255.255

попробуйте добавить больше заданий cron, которые запускаются каждую минуту и ​​регистрируют:

  • факт выполнения задания [дата >> журнал]
  • содержимое таблицы arp, конфигурация ip [arp -n >> log; ip a >> журнал]
  • состояние сетевого интерфейса [ethtool -i eth >> log]
  • сообщения журнала не повредят вам [dmesg -c >> log]
  • результат проверки связи с маршрутизатором, проверки связи с несколькими «соседними» хостами из той же подсети.
  • принудительная синхронизация для хорошей меры

это должно помочь вам определить, зависает ли вся машина целиком или только сетевые проблемы, и если да, то с чего они начинаются.

Может, это конфликт IP-адресов или, что еще лучше, дубликат Mac в том же сегменте?