Я пишу плагин Nagios для отслеживания тенденций использования определенных ресурсов хранилища (например, постепенное увеличение - это нормально, но мгновенное / внезапное увеличение или уменьшение использования ресурсов может указывать на проблему). Как бы то ни было, он просматривает последние N записей в файле RRD, созданном настраиваемым источником данных / шаблонами кактусов.
Каков "правильный" способ обработки конфигурации / реализации уведомлений Nagios для этого? Проблема в том, что плагин выйдет как предупреждение / критическое за один период опроса, но в следующий будет нормально (или через 3 периода опроса, если я посмотрю на данные за 3 периода опроса).
Думаю, вопрос в следующем: следует ли мне просто написать его таким образом, чтобы он предупреждал о периодах опроса X, или я должен найти способ написать его так, чтобы для его очистки требовалось ручное вмешательство (например, вход в систему мониторинга сервер или нажатие URL-адреса для запуска сценария, который отправляет пассивный результат)?
Ваш вклад приветствуется, и если у вас есть какие-либо советы о том, как реализовать последнее, я открыт для них (я могу придумать несколько способов его реализации)
edit: «Ответ» от dunxd ниже помогает более кратко изложить то, что я ищу. Я реально ищу информацию о том, как лучше всего иметь / реализовать «липкое» предупреждение в Nagios. Я видел это с другими системами, но пока не с Nagios.
Я думаю, он должен оставаться неизменным до тех пор, пока результат тренда не перестанет соответствовать уровням предупреждений (которые должны соответствовать расчетной вами скорости). На самом деле, это не так уж важно. :>
Это зависит от того, как будут обрабатываться предупреждения. Вы хотите, чтобы кто-то заметил, когда происходит пороговое событие.
Если они создают электронные письма это не будет проигнорировано, или вы знаете, что кто-то регулярно проверяет тенденции Nagios, тогда, вероятно, можно просто использовать стандартное поведение Nagios.
Если вы не думаете, что это привлечет чье-то внимание, тогда вам нужно, чтобы статус службы был «липким». Я не знаю ни одной проверки Nagios с таким поведением, но мне тоже было бы интересно узнать о ней.