Скажем, я пытаюсь контролировать компьютер с помощью Nagios, но есть неконтролируемый процесс, который крадет почти 100% процессора и оперативной памяти компьютера. Как в этом случае Nagios продолжает предупреждать меня о статусе ящика? Что должно помешать неконтролируемому процессу блокировать запуск Nagios?
Если отслеживаемый сервер перегружен, Nagios или любая другая программа мониторинга не может работать на этом сервере.
Но не беспокойтесь, вы получите свои драгоценные оповещения: вы узнаете ситуацию о том, что каждый тест Nagios, отслеживающий сервер, будет тайм-аут.
Хотя, если вы имели в виду, что у вас все, включая Nagios, работает на одном сервере, тогда ваш Nagios уязвим для внезапной смерти. Всегда имейте отдельный сервер мониторинга, иначе мониторинг будет бесполезен: он выйдет из строя в тот самый момент, когда он вам действительно понадобится!
Вы также можете рассмотреть возможность установки некоторых информативных мониторов, таких как средняя нагрузка. Сделайте так, чтобы Nagios предупреждал вас, если средняя загрузка превышает критическую точку.
Графическое отображение различных аспектов сервера, таких как использование ЦП, памяти и диска с помощью MRTG, Cacti или Nagiosgraph, также полезно и помогает вам следить за тенденциями.