Мы расширяем нашу установку Nagios 3 и часто сталкиваемся с новыми плагинами NRPE или общими плагинами Nagios для тестирования существующей инфраструктуры. Хотя это и мелочи - было бы полезно получить сводку плагинов, которые больше всего ценят пользователи Nagios.
Пожалуйста, укажите один плагин для каждого сообщения, желательно с кратким описанием того, почему он вам нравится, и ссылкой на сайт MonitoringExchange или разработчика плагинов. Таким образом, люди могут голосовать за уже перечисленные плагины, и мы можем видеть их в приоритетном порядке.
По той же причине было бы лучше не перечислять плагины, о которых уже упоминали другие. Если у вас есть что добавить в отношении плагина, который перечислил кто-то другой, оставьте комментарий к его ответу.
Спасибо!
С точки зрения гибкости вы не можете превзойти плагин snmp. Он стоит почти за каждой проверкой, которую я выполняю, а если это не так, то за TCP-соединение.
Наши самые полезные плагины - это те, которые проверяют более высокую функциональность нашего приложения. Например, у нас есть тесты, которые пытаются войти на веб-сайт, и тесты, которые пытаются отправить электронное письмо и проверять почтовый ящик pop3, чтобы убедиться, что оно пришло. Если что-то из этого сломается, мы можем использовать проверки более низкого уровня, чтобы увидеть, что не так. Поп3 мертв? MTA, MDA? Сервер базы данных? хранилище данных?
WebInject очень полезен для мониторинга веб-сайтов, если вы хотите выйти за рамки функций check_http; он может обрабатывать страницы входа и выполнять несколько шагов за одну проверку Nagios.
Честно говоря, тот, который больше всего делает для меня, просто старый check_disk
. Ничто не заставляет меня чувствовать себя таким особенным в этом способе «перестань есть пасту», как если сервер, который вчера работал нормально, взорвался, бегал как сумасшедший, а затем обнаружил, что это потому, что я позволил дискам заполниться. Больше никогда в жизни этого не делать.
(И не забудьте проверить inodes, пока дети смотрят дома.)
PNP (pnp4nagios.org) - генерирует графики в стиле RRD для любой проверки Nagios, которая выводит perf. данные. Чрезвычайно полезно, особенно когда вы пытаетесь убедить разработчиков, что эта недавно установленная служба действительно является причиной всех этих скачков производительности процессора ...
Самый полезный из них - это тот, который я написал сам, который проверяет сертификаты SSL на наших веб-серверах, чтобы я мог следить за истечением срока действия.
я нахожу check_nfsmount полезно на многих моих серверах.
Изменить: я бы также проголосовал за check_snmp, если бы у меня был представитель для этого. Он используется на всех моих серверах, плюс логика check_hpjd, которую я использую на всех моих принтерах HP.
check_nt (общение с NSClient или что-то подобное по этому поводу) позволяет вам опрашивать WMI в окне Windows - если для него есть счетчик производительности, теперь вы можете отслеживать его с помощью Nagios.
Самым полезным для меня является тот, который я написал для своих нужд: nagios-check-webpage
Он загружает целую страницу с js / css / images, с многопоточностью и gzip (экономит много трафика), как настоящие навигаторы.
Мне нравится check_http, чтобы проверять, что мои веб-сайты все еще работают, я расширил его, чтобы проверить, что на нем можно найти определенный текст после того, как однажды моя хостинговая компания решила обслуживать пустые страницы, и все мои проверки nagios прошли, поскольку сервер все еще работал.
Я согласен, что check_snmp - чрезвычайно ценный плагин; его можно использовать практически для любых целей, и вообще все отображается в SNMP. SNMP доступен в таких разнообразных системах, как HP-UX, Tru64 и OpenVMS, без дополнительных установок.
Еще один (не совсем) очень полезный плагин - NagiosGrapher; У меня есть опыт в статья это объясняет больше, но также и для того, чтобы другие могли использовать его без каких-либо трудностей, с которыми я столкнулся.
И последнее: NSCA. Вы можете написать сценарий Perl, Ruby или ksh и передать результат в NSCA.
Между гибкостью NSCA и SNMP в сочетании с отчетностью NagiosGrapher это должно очень хорошо расширить ваш мониторинг.
Это немного бесстыдный плагин, но если вы отслеживаете машины Windows с помощью NRPE, NagiosPluginsNT вроде работает неплохо. ;-)
Ну, простые, простые и стандартные - check_disk, check_load, check_http подходят для большинства случаев (в основном мы хотим знать, работают ли серверы и веб-сайты, верно)
и кроме check_disk и check_swap есть check_memory http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/check_memory/details что дает обычаю памяти ...
Не совсем плагин, но получаю twurl ( https://github.com/marcel/twurl ) для работы в качестве средства подачи сигналов тревоги было абсолютной находкой. Нет необходимости в SMS-оповещениях и просто удовлетворить все потребности.
Подробно о том, как это было сделано: Предупреждения Nagios с использованием твиттера (с twurl) не срабатывают - извинения за бессовестную саморекламу;)
Другие вещи...
Check_diskio ( https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio ) был невероятно полезен в сочетании со стандартной проверкой загрузки ЦП и номера процесса при определении, когда / если и каким образом привязан ввод-вывод. Используя нагиосграф ( http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details) делает это еще проще.
check_curl для меня был находкой. Действительно повлиял на гибкость при проверке веб-сайтов, а также обнаружил, что это намного проще, чем webinject, с почти всеми теми же функциями, которые мне нужны.
Один из самых важных плагинов - это тот, который я написал сам: check_rdiff_backup. Я делаю резервные копии за границей, и Nagios сообщает мне, когда с ними что-то происходит.
Если вы ищете плагин rdiff-backup, вы можете найти его в Google.
Тот, который проверяет фактическую задержку при открытии веб-сайтов и сканирует их на наличие скрытого тега status: ok. Он обнаружил проблему с нашим кешем Squid и проблему с языковым набором, которая возникала только раз в несколько ночей в 3 часа ночи, когда кто-то заходил на сайт с браузером, который запрашивал интернационализированную версию страницы на турецком языке.
Серьезно, настройте все возможные типы мониторинга. Странные ошибки и ошибки, которые вы можете обнаружить в сложной среде с хорошим мониторингом, просто потрясающие. Кроме того, зарегистрируйте данные о производительности в базе данных rrd и отобразите их в Cacti.
Номер один NagiosWSC Это позволяет вам делать безагентный мониторинг хостов Windows через WMI
Я использовал два плагина ... один для предоставления XML-потока предупреждений, а другой для отправки предупреждений через твиттер. Оба были полезны (кроме обычных плагинов). если вы считаете NRPE плагином, то добавьте и его.
Это своего рода читерство, потому что я много работал над ним, и он фактически проверяет множество разных вещей одновременно, но самый полезный плагин nagios для меня - это Resmon. Это агент, который вы запускаете на самом сервере, и nagios подключается через http для выполнения проверок. Я думаю, это похоже на то, что делает nrpe, но с рядом других дизайнерских решений.
check_multiprocs используется с check_nrpe текст ссылки
Centreon определенно для графиков и всех функций Nagios!
check_apt действительно крутой и напоминает мне об обновлении моих серверов Debian.
Недавно я начал использовать check_multi плагин, используя исправленный / улучшенный NRPE для большого вывода (из-за HTML и информации о производительности).
Это почти «один плагин, чтобы править всеми»! ;-)