Я использую Zabbix 3.0 для мониторинга нашего главного коммутатора, в котором порт брандмауэра, а также другие порты показывают то, что кажется отбрасыванием отправки или получения. Можно было бы сделать вывод, что, если бы этот трафик сбрасывался с коммутатора, он мог бы быть чрезмерно загружен, что отбрасывание будет согласованным для всех портов, но это не так. Периодически у нас действительно возникают проблемы с внешней связью на виртуальной машине, загружающей данные от клиента, которые зависают, но время между этим симптомом и данными, считываемыми Zabbix, в которых я бы сказал, что возможность нашего источника для загрузки может испытывать проблемы, или мы, но, конечно, наш интернет-провайдер отрицает какие-либо перебои в работе и показал, что в эти периоды времени наши приходящие отказы были стабильными. На первом изображении показаны капли на входящем порту для переключения с ASA. ПРИМЕЧАНИЕ: с 4:55 до 5:01 утра он ничего не показывает, и значение должно быть прямым 0. В то же время случайный порт также показывает эту потерю, однако с 5:34 до 5:41 утра входящий показывает потерю от ASA к коммутатору, однако тот же случайный порт не показывает потерь. Наконец, с виртуальной машины, на которой запущен клиент Zabbix, видно, что связь никогда не прекращается.
На этом изображении показаны случайные потери, полученные от случайного порта коммутатора Cisco SG200-50.
Случайная виртуальная машина не показывает никаких потерь в течение этого периода времени.
Служба поддержки Cisco сбита с толку, потому что, если бы это был плохой коммутатор, они считают, что это был бы узнаваемый образец, однако не исключили возможных скачков ЦП в коммутаторе, когда это произойдет, поскольку мне сказали, что не может извлечь эти данные из коммутатора, поскольку он переключатель "малого бизнес-класса".
Другие соображения: порты не настроены в LAG, так как узлы Hyper-V настроены. Группы сетевых адаптеров настроены так, как они настроены в независимом от коммутатора режиме на узле Windows Server 2012 R2. Ниже приведен снимок экрана конфигурации с использованием PowerShell, выполняющего командлет Get-NetLbfoTeam. В то же время я не вижу потери связи через VPN-туннель с удаленным сайтом, контролирующим точку беспроводного доступа, и Zabbix-серверу приходится разговаривать через порт на коммутаторе, который подключен к ASA, чтобы достичь WAP.
Когда я спросил Cisco, следует ли это изменить, поскольку этот коммутатор поддерживает LAG, они сказали, что это не должно иметь значения для того, как я вижу возможные потери данных в Zabbix. Я просмотрел различные форумы Zabbix, но не смог найти ничего, что можно было бы попробовать изменить, но я настроил сервер для большего количества одновременных подключений, чтобы, возможно, устранить в Zabbix что-то, что могло приводить к неточным показаниям. В Zabbix я сейчас контролирую менее дюжины узлов. Я уверен, что виртуальная машина достаточно оснащена 4 ядрами и 4 ГБ оперативной памяти на недостаточно загруженном хосте с низким объемом дискового ввода-вывода. Когда я смотрю на использование сервера Zabbix, оно кажется очень малоиспользуемым. Ниже приведен снимок экрана сервера Zabbix 3.0. ПРИМЕЧАНИЕ. Я запускаю устройство вместо создания с нуля по двум причинам. Один только для тестирования продукта, а два с небольшим количеством отслеживаемых элементов не должны иметь проблем с мониторингом 5 элементов.
CPU is idle 99.4% of the time
CPU spikes are less than 1%
Memory usage is roughly 70-75%
Network traffic us usually below 50Kbps with small spikes to around 240Kbps
100% free swap space
Zabbix value cache hits 7.21-7.46
No cache misses during the SNMP losses
Ниже мой файл конфигурации Zabbix сервера /etc/zabbix/zabbix_server.conf
С помощью дедукции я возвращаюсь к коммутатору, однако как мне получить достаточно данных для Cisco, чтобы заменить коммутатор или устранить основную причину в следующем обновлении. Коммутатор работает под управлением микропрограммного обеспечения и загрузки, и служба поддержки Cisco не заявляла, что какие-либо конкретные обновления будут конкретно адресовать точность данных SNMP от коммутатора. Помимо обновления прошивки, которую я собираюсь сделать во время следующего запланированного отключения для обновлений других систем, я в любом случае сделаю это. Есть предложения, которые помогут определить эту основную причину?