Я использую Nagios для мониторинга около 30 коммутаторов Cisco 2960 (check_snmp_load, check_snmp_int). Я проверяю только нагрузку и один или два магистральных интерфейса каждого коммутатора. Я получаю много ложных срабатываний из-за отсутствия ответа от устройств. Я предполагаю, что UDP-пакеты SNMP где-то теряются, но мне не удалось это устранить. Я проверил sh int summary
на каждом коммутаторе и нет информации об отброшенных пакетах (IQD или OQD).
Тот же экземпляр Nagios отслеживает десятки других устройств (серверы Linux, iDRAC / iLO, коммутаторы SAN, ленточные библиотеки и т. Д.), И с ними всегда все в порядке.
Единственная разница в инфраструктурных соединениях между Nagios и 2960 / другими устройствами состоит в том, что 2960 подключаются через довольно старую инфраструктуру FC. Неужели дело в кабелях FC? Как это проверить (не покупая дорогих сетевых замеров)? Я уже использовал iperf но проблем не выявило.
Что еще я могу сделать для устранения этой проблемы?
Обновление: моя конфигурация SNMP на 2960s довольно проста:
#sh run | include snmp
snmp-server community commstr RO
на переключателе можно включить
deb snmp packet
тогда вы увидите каждый пакет snmp, входящий / исходящий в ваш коммутатор. на сервере nagios используйте tcpdump или tskark (wirehark) для прослушивания сети. если вы отслеживаете и то, и другое одновременно, вы сможете сказать, вызвана ли проблема потерей пакетов или нет.