Назад | Перейти на главную страницу

Маршрутизатор Cisco ISR4431 случайным образом перезагружается

У меня есть действующий пограничный интернет-маршрутизатор Cisco ISR4431, который случайным образом перезагружается каждые 5 дней или около того. Когда он перезагружается, требуется от 10 до 60 минут, прежде чем он будет восстановлен, и сетевой трафик будет проходить нормально. Он использует BGP и маршрутизацию для сетей / 19 и / 20, поэтому для этого класса боксов это относительно небольшая нагрузка.

Единственная подозрительная вещь, которую я вижу, - это 94% памяти, поэтому я подозреваю, что она содержит больше маршрутов BGP, чем следовало бы, хотя эта же конфигурация годами работала в более старом маршрутизаторе, не становясь нестабильной. Я не совсем уверен, как диагностировать проблему дальше, и я не знаю, связана ли это с аппаратной проблемой конфигурации.

К сожалению, роутер находится на другом конце страны, и у меня нет физической возможности добраться до него, пока не закончится карантин.

sh ver:
Cisco IOS XE Software, Version 03.16.04b.S - Extended Support Release
Cisco IOS Software, ISR Software (X86_64_LINUX_IOSD-UNIVERSALK9-M), Version 15.5(3)S4b, RELEASE SOFTWARE (fc1)

sh logging
*Apr 28 14:47:09.074: %LINK-3-UPDOWN: Interface GigabitEthernet0/0/2, changed state to up
*Apr 28 14:47:10.074: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/0/2, changed state to up
*Apr 28 14:50:12.834: %PLATFORM-4-ELEMENT_WARNING:smand:  RP/0: Committed Memory value 94% exceeds warning level 90%
*Apr 28 14:52:00.253: %IOSXE_INFRA-6-PROCPATH_CLIENT_HOG: IOS shim client 'fman stats bipc' took 685 msec (runtime: 256 msec) to process a 'tdl_qfpmib_throughput_data' message
*Apr 28 15:00:14.511: %PLATFORM-4-ELEMENT_WARNING:smand:  RP/0: Committed Memory value 94% exceeds warning level 90%

sh processes cpu sorted
CPU utilization for five seconds: 13%/0%; one minute: 3%; five minutes: 3%
 PID Runtime(ms)     Invoked      uSecs   5Sec   1Min   5Min TTY Process 
 193      230311        5004      46025 12.39%  1.63%  1.22%   0 BGP Scanner      
 117       22772      228335         99  0.15%  0.10%  0.10%   0 IOSXE-RP Punt Se 
 240       31843     1902016         16  0.07%  0.14%  0.15%   0 Inline Power     
 414        2694       20294        132  0.07%  0.00%  0.00%   0 NTP              
 284       18520      605984         30  0.07%  0.09%  0.08%   0 HTTP CORE        

Раздел конфигурации BGP выглядит так:

router bgp 7835
 no bgp log-neighbor-changes
 neighbor ZZ.ZZ.6.113 remote-as XXX
 neighbor ZZ.ZZ.6.113 password XXXXXX
 !
 address-family ipv4
  network XX.XX.160.0 mask 255.255.240.0
  network YY.YY.64.0 mask 255.255.224.0
  network YY.YY.79.0
  neighbor ZZ.ZZ.6.113 activate
  neighbor ZZ.ZZ.6.113 soft-reconfiguration inbound
  neighbor ZZ.ZZ.6.113 filter-list 1 out
 exit-address-family
!

Дальнейшая диагностика:

sh platform resources
**State Acronym: H - Healthy, W - Warning, C - Critical                                             
Resource                 Usage                 Max             Warning         Critical        State
----------------------------------------------------------------------------------------------------
RP0 (ok, active)                                                                               C    
 Control Processor       32.12%                100%            90%             95%             H    
  DRAM                   3849MB(99%)           3872MB          90%             95%             C    
ESP0(ok, active)                                                                               H    
 QFP                                                                                           H    
  DRAM                   1663176KB(79%)        2097152KB       80%             90%             H    
  IRAM                   0KB(0%)               0KB             80%             90%             H    

объем памяти

show processes memory sorted
Processor Pool Total: 1688347248 Used: 1417980160 Free:  270367088
 lsmpi_io Pool Total:    6295128 Used:    6294296 Free:        832

 PID TTY  Allocated      Freed    Holding    Getbufs    Retbufs Process
 510   0  904032136   54730248  901424352          0          0 BGP Router      
 271   0  257116280    1297600  256693920          0          0 IP RIB Update   
   0   0  352326368  108678280  227122576          0          0 *Init*          
  79   0    8209072      12176    7592984          0          0 IOSD ipc task   
 389   0    3889024       5160    3925856     799092          0 EEM ED Syslog   
 409   0    1439256      26792    1442328          0          0 EEM Server      
 155   0    3223184      91024    1057808          0          0 CWAN OIR Handler