Назад | Перейти на главную страницу

Zabbix «Мониторинг приложений» - как определить «зависшее» зависшее приложение

У меня работает Zabbix Server на Ubuntu ... У меня установлен агент на моем сервере Windows. Template_Windows творит чудеса и дает мне всевозможную статистику, с которой я рад поиграть ...

Проблема в том, что я пытаюсь отслеживать приложение. Не сервис или сайт. Приложение.

У меня есть одно приложение, которое любит неожиданно вылетать. Я хотел бы иметь возможность получать предупреждение «Программа не отвечает» (а затем перенаправлять его по электронной почте / sms / отчетам).

У меня есть другой сервер с приложением, на котором я хочу отслеживать статистику (использование процессора и т. Д.).

Я вижу, как контролировать службы ... но это не службы. Это приложения, которые запускаются, когда «Пользователь» вошел в систему. Я не могу найти хорошего руководства о том, как настроить что-то подобное.

Изменить: проводить дальнейшие исследования и возиться ... Возникает вопрос: независимо от метода, как мне определить, что приложение зависло / зависло / не отвечает?

Кажется, что-то не работает. Как только я могу проверить зависший процесс, я могу ответить с помощью задачи-уничтожения / перезапуска, электронной почты ответственной стороны и т.д., но я просто не могу найти изящный способ обнаружить зависший процесс / приложение.

Мне потребовалась вечность, чтобы получить simple-checks работает. Приложения еще не пробовал.

Второй пост тут вообще помогает? http://www.zabbix.com/forum/showthread.php?t=18206

Вы можете пойти в нескольких направлениях.

Вероятно, два самых простых варианта - создать пользовательский параметр, который запускает сценарий в клиентской системе для проверки работоспособности вашего приложения. Однако, если это занимает более 30 секунд, вам, скорее всего, лучше всего будет настроить скрипт, который затем отправляет данные о работоспособности в Zabbix с помощью zabbix-sender. С другой стороны, вы можете сделать несколько вещей, возможно, одним из самых простых будет запуск по nodata () и комбинации last () = errorvalue. Проверка узловых данных работает лучше всего, если у вас есть cron, отправляющий данные, поскольку время проверки не контролируется Zabbix.

Об этом было несколько обсуждений на форуме Zabbix.

http://www.zabbix.com/forum