У меня есть nagios, работающий с nrpe, но я относительно новичок в его настройке.
Есть ли способ получить необработанные числа для проверок, вместо того, чтобы просто нормально / не нормально?
Например, если я хочу отслеживать использование памяти хостом в процессе, который выполняется в течение нескольких часов, и видеть, как оно колеблется, может ли nagios это сделать, или он только скажет мне, сработает ли какой-то порог?
Я считаю, что вам нужен RRDtool для сбора данных. я использую check_mk который представляет собой набор расширений для Nagios, но есть множество других вариантов.
Как правило, nagios уведомляет вас о порядке / не в порядке. Я думаю, можно с уверенностью сказать, что большинство людей используют нагио, чтобы сообщить им, происходит ли что-то странное в их среде. Он отображает числа для текущего состояния, но это не похоже на то, о чем вы просите.
Раньше я извлекал значения из nagios.log. Это некрасиво, но выполнимо, и если это разовый вариант, это может быть вашим лучшим выбором. (Пример: меня однажды попросили вытащить историю Exchange, потребляющего все свое хранилище за определенный период времени.)
Если вместо этого вы ищете nagios, чтобы постоянно проверять колебания, вы могли бы написать какой-нибудь собственный скрипт для запуска npre, который определяет ok / not ok как «слишком сильно колеблется».
Надеюсь, это поможет.
Существуют различные надстройки RRD (специальный тип базы данных для сбора данных о времени) к nagios.
Однако nagios - плохой выбор для такого рода мониторинга производительности. Он действительно лучше всего работает как система оповещения, и большинство сайтов используют что-то еще, например, ганглии или кактус, для постоянного отслеживания производительности.
Nagios - это дымовая сигнализация, ганглии - это градусник.
В каждой проверке есть третье поле, в которое вы можете поместить любые данные, которые захотите, но для этого потребуется поиск в файле nagios.log.
Nagios лучше всего подходит для служб мониторинга, чтобы вы получали уведомление, если служба / коробка не работают. Я бы посоветовал munin для построения графиков системных ресурсов, munin также имеет функцию предупреждений, если значение ресурса превышает пороговое значение. Я использую munin (как дополнительный инструмент мониторинга) с Amazon SNS для получения предупреждений.
Nagios в основном система оповещения как сказали другие, то есть нет встроенной системы исторической отчетности.
Однако есть много дополнений, которые сделают эту работу за вас. Я считаю NagiosGraph является наиболее распространенным, достаточно простым в установке и использовании.
У вас могут быть ежедневные, еженедельные, ежемесячные и годовые просмотры вашей метрики, а также вы можете создавать свои собственные графики для своих плагинов, манипулируя отображением метрик (файл карты нагиографа).
Так сказать, из коробки Nagios ничего не делает с фактическими возвращаемыми данными; Вы используете надстройку, которая подключается к Nagios для обработки данных. Одно из самых популярных дополнений для построения графиков этих перфданных - pnp4nagios. Он хорошо интегрируется с веб-интерфейсом, прост в настройке и также включен в несколько дистрибутивов Linux.
Для других вариантов см. категория надстройки для построения графиков / трендов на Nagios Exchange.