Назад | Перейти на главную страницу

Как сделать так, чтобы nagios не являлись хостами классов, которые перестали работать как необработанная проблема?

Я слежу за рабочими столами в рабочее время. Некоторые рабочие столы не включаются только один или два раза в неделю. Я отключил для них уведомления хоста, но активные проверки по-прежнему не работают, и «хост не работает» по-прежнему отображается как необработанная проблема в nagios / multisite. Как сделать хост до не быть проблемой? Также я хочу, чтобы активные проверки оставались «ОК» (последнее состояние), пока хост не работает.

@Posipiet: все наши рабочие столы работают под управлением Linux (debian или ubuntu), и я хочу убедиться, что они подключены к Интернету, не ожидают обновления, не исчерпывается дисковое пространство и память и т. Д. Некоторые из наших сотрудников недостаточно технические самостоятельно управлять машинами. Я хочу получить уведомление, подключиться по ssh и исправить это, чтобы пользователи не заметили. Но я не хочу, чтобы меня спамили, когда они в отпуске.

Я не думаю, что настольные ПК должны контролироваться Nagios, но, возможно, Разрешить хосту под наблюдением Nagios могу помочь тебе.

Возможно, вам стоит изучить программное обеспечение инвентаризации, такое как OCSinventory: http://www.ocsinventory-ng.org/en/

Nagios не предназначен для мониторинга систем, которые не всегда включены. Заставить его хоть как-то работать в этой ситуации всегда будет непросто.

Для рабочих станций мы используем OCSinventory, который также перечисляет дисковое пространство и т. Д. Для серверов мы используем Icinga.

Запланированное время простоя возможно это то, что вы хотите.

Хотя мне действительно не нравится идея мониторинга ненадежных хостов в Nagios, у меня есть для вас возможное решение. Реализуйте на свой страх и риск.

Установите сценарий на каждый рабочий стол, который будет сообщать Nagios: «Я ухожу, и все в порядке», когда машина завершает работу, и, наоборот, при загрузке говорит: «Я вернулся, пожалуйста, следите за мной». Если вы сделаете запрос к CGI на стороне клиента, вы можете определить любой механизм, который вам нравится, на стороне сервера на досуге. Я бы, вероятно, попросил этот сценарий полностью отключить все проверки хоста и служб, но вы могли бы установить (очень долгое) время простоя или что угодно, что вам нравится.

Это не сработает, если у людей есть привычка резко переключать свои машины, но это проблема обучения пользователей (потому что вы не хотите, чтобы они делали это даже без сценария подавления Nagios).

В противном случае, учитывая, что вы действительно заботитесь только о нескольких случайных не-услугах (ожидающие обновления, дисковое пространство и т. Д.), Я бы, вероятно, просто полностью отказался от активных проверок и пошел с пассивными проверками. Это больше похоже на ловушки SNMP, чем на активный мониторинг, и они намного лучше подходят для модели Nagios.