В настоящее время мы используем несколько воркеров Nagios для распределения нагрузки с помощью DNZ, как описано здесь: https://assets.nagios.com/downloads/general/docs/Distributed_Monitoring_Solutions.pdf. Мне не удалось найти никакой информации по этому поводу в официальной документации, и большинство поисковых запросов просто связывают меня с их веб-сайтом. Игнорирование требуемой вычислительной мощности (ЦП, ОЗУ и т. Д.) Существует ли какое-либо жесткое ограничение на количество хостов или служб, которое может отслеживать один экземпляр Nagios? А как насчет отдельного работника?
Я не уверен, спрашиваете ли вы об ограничениях конфигурации или ограничениях времени выполнения. Или оба.
Если вы спрашиваете, есть ли ограничение на количество объектов (хостов / служб / команд / контактов / чего угодно), которые будет обрабатывать синтаксический анализатор, ответ будет выглядеть как «нет» (глядя на источник для анализатора). Если у вас не закончится память во время синтаксического анализа.
Когда вы попадаете на территорию с десятками тысяч объектов (и более), время, необходимое для анализа конфигурации, может резко увеличиваться. Однако это больше проблема с v3, чем с v4. См. Страницу документации на Параметры быстрого запуска для получения дополнительной информации.
Если вы спрашиваете об ограничениях времени выполнения, опять же, нет предварительно настроенного или жестко запрограммированного верхнего предела. Единственное, что действительно имеет значение, это проверок в секунду.и сможет ли ваше оборудование с этим справиться. В этом отношении 10 тыс. Хостов (или служб) с 5-минутным интервалом проверки равны 2 тыс. Хостов / служб с интервалом в 1 минуту.
Наблюдение (и отслеживание) средних задержек проверки и времени выполнения от nagiostats
- хороший способ оценить проблемы емкости Nagios.
Есть несколько простых настроек, которые могут иметь большое значение, например, загрузка результатов проверки на RAM-диск и использование check_icmp
вместо того check_ping
. Есть хорошие предложения по Настройка Nagios для максимальной производительности страница. (Но на этой странице также предлагается использовать диски UltraSCSI вместо IDE, чтобы дать вам некоторое представление о том, насколько он актуален ...)
Причина, по которой у вас так много проблем с поиском окончательной информации о параметрах Nagios, заключается в том, что нет двух одинаковых установок и слишком много переменных, чтобы можно было сказать «вы можете выполнять X проверок в секунду на каждое ядро» или что-то подобное.