У меня есть старый сервер (на основе P4), на котором работает nagios (и все другие инструменты для мониторинга).
В последние несколько недель мы наблюдаем странное поведение.
В каталоге / var / spool / pnp4nagios (где временные файлы хранятся до обработки демоном pnp4nagios) у нас есть много файлов, таких как perfdata.1274949941-PID-18839, и мы получаем ошибку в npcd.log:
[05-27-2010 11:17:46] NPCD: ThreadCounter 0/15 File is perfdata.1274951306-PID-27849
[05-27-2010 11:17:46] NPCD: File 'perfdata.1274951306-PID-27849' is an already in process PNP file. Leaving it untouched.
Иногда какой-то график не строится. Сервер довольно загружен (обычно около 5-6), и я подозреваю, что npcd выходит из строя и оставляет эти файлы позади. Что я мог сделать (кроме смены сервера)?
Немного информации о системе:
centos 5.5
нагиос 3.2.1
pnp4nagios 0.6 (из исходников)
Спасибо
Я не уверен, что это то, что вы ищете, но вы можете взглянуть на увеличение времени ожидания в process_perfdata.cfg. нашел эту информацию на сайт nagios-портала
Эта ошибка исчезла, когда я перешел от классической конфигурации pnp4nagios (массовая) к более эффективному режиму npcd и модулю nagios (npcdmod).
Мне удалось немного ускорить сервер с помощью инструментов google perftools в Nagios и pnp4nagios. По крайней мере, сейчас мы не теряем никаких данных о производительности.
Наверное, лучшим способом остается сменить сервер.