Назад | Перейти на главную страницу

Проблема мониторинга активной проверки Zabbix

Я новичок в инструменте мониторинга zabbix, и я столкнулся с некоторыми проблемами при настройке мониторинга на основе активной проверки. Сервер Zabbix размещается в облаке AWS, а отслеживаемый сервер размещается в центре обработки данных. Между этими серверами настроен какой-то брандмауэр. Я установил zabbix-agent на клиент-сервер и добавил хост в пользовательский интерфейс zabbix. Когда я проверяю журналы, все, что я вижу, это сообщение об ошибке
Get value from agent failed: cannot connect to {server:10050}: interrupted system call.

Вот что я сделал до сих пор.
1. установил агент zabbix на сервер.
2. Установите IP-адрес Zabbix сервера в опции «Сервер».
3. Установите для StartAgent значение 0.
4. Установите ServerActive как IP-адрес zabbix сервера.
5. Указано имя хоста (такое же, как имя хоста, на котором запущен агент zabbix) 6. Добавлен агент в пользовательский интерфейс zabbix
7. Изменен шаблон элементов ОС и zabbix агента с помощью zabbix-agent (активный)
8. перезапустил клиентскую и серверную службы.

Сервер и клиент Zabbix установлены в RHEL.

Когда я делаю telnet на сервер от клиента с портом 10050/10051, он может подключиться, и наоборот, не происходит. Порт zabbix не включен / не разрешен на стороне клиента. Но для настройки активных проверок это не требуется, поскольку я прошел через многие потоки. Из клиентских журналов я вижу, что определенные проверки выполняются, но пользовательский интерфейс по-прежнему показывает красный цвет.

Спасибо за ответ :) Есть ли способ подтвердить правильность настроенной активной проверки. Я вижу, что клиент взял контрольный список конфигурации и обработал его. См. Приложенные журналы из журнала агента.

 23679:20160107:172925.431 In evaluate_function() function:'HOSTNAME:proc.num[,,run].avg(5m)'
 23679:20160107:172925.431 In evaluate_function() function:'HOSTNAME:proc.num[].avg(5m)'
 23679:20160107:172925.431 In evaluate_function() function:'HOSTNAME:system.cpu.load[percpu,avg1].avg(5m)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:system.cpu.util[,iowait].avg(5m)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:system.swap.size[,pfree].last(0)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:vm.memory.size[available].last(0)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:vfs.fs.inode[/,pfree].last(0)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:vfs.fs.inode[/boot,pfree].last(0)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:vfs.fs.inode[/tmp,pfree].last(0)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:vfs.fs.inode[/var,pfree].last(0)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:vfs.fs.inode[/var/tmp,pfree].last(0)'
 23679:20160107:172925.433 In evaluate_function() function:'HOSTNAME:vfs.fs.inode[/apps,pfree].last(0)'
 23679:20160107:172925.433 In evaluate_function() function:'HOSTNAME:vfs.fs.size[/,pfree].last(0)'
 23679:20160107:172925.433 In evaluate_function() function:'HOSTNAME:vfs.fs.size[/boot,pfree].last(0)'
 23679:20160107:172925.433 In evaluate_function() function:'HOSTNAME:vfs.fs.size[/tmp,pfree].last(0)'
 23679:20160107:172925.433 In evaluate_function() function:'HOSTNAME:vfs.fs.size[/var,pfree].last(0)'
 23679:20160107:172925.433 In evaluate_function() function:'HOSTNAME:vfs.fs.size[/var/tmp,pfree].last(0)'
 23679:20160107:172925.433 In evaluate_function() function:'HOSTNAME:vfs.fs.size[/apps,pfree].last(0)'

Есть ли вероятность неисправности существующего сервера zabbix, если я обновлю его до Zabbix-3.0, а стабильная версия будет доступна или нет? Какие шаги мне следует предпринять, чтобы убедиться, что активная проверка настроена правильно.

Есть два вида проверок Zabbix агента: пассивные и активные. Пассивные проверки - это когда Zabbix сервер подключается к Zabbix агенту. Активные проверки - это когда Zabbix агент вместо этого подключается к Zabbix серверу.

В Не удалось получить значение от агента: невозможно подключиться к {server: 10050}: системный вызов прерван. у тебя на красном Z в веб-интерфейсе Zabbix относится к пассивным проверкам. Состояние активных проверок не отображается на этом значке. Так что если у вас успешно работают активные проверки, ничего страшного.

Дело в том, что красный Z не сбрасывается, например, если используются только активные проверки, это известная проблема. Это было недавно исправлено для Zabbix 3.0 под ZBX-1916.