Я использую один Munin-Master для мониторинга более 20 серверов, все работают нормально, за исключением одного сервера. Последние три письма от Munin:
05:25
Infra :: backup2.infra :: Использование диска в процентах OKs: / var - 22,55, / run / user / 1001 - 0,00, / home - 8,87, / mnt / usb1 - 30,55, / export / oxa - 51,58, / tmp - 0,60, / dev / shm - 0,00, / space2 - 40,39, / run - 8,77, / run / lock - 0,00, / run / user / 65534 - 0,00, / space - 76,38, / sys / fs / cgroup - 0,00, / составляет 18,46.
Infra :: backup2.infra :: Использование inode в процентах OKs: / dev / shm = 0,00, / run = 0,05, / space2 = 7,44, / run / user / 65534 = 0,00, / run / lock = 0,00, / sys / fs / cgroup - 0,00, / space - 0,24, / - 8,07, / dev - 0,03, / home - 0,13, / mnt / usb1 - 0,51, / export / oxa - 0,01, / tmp - 0,02, / var - 2,02, / run / user / 1001 равно 0,00.
07:00
Infra :: backup2.infra :: Использование inode в процентах. ОК: / home - 0,13, / var - 2,02, / run / user / 1001 - 0,00, / dev / shm - 0,00, / run - 0,05, / run / lock - 0,00, / пробел - 0,24, / run / user / 1003 - 0,00, / tmp - 0,02, / - 8,07, / space2 - 7,44, / mnt / usb1 - 0,51, / export / oxa - 0,01, / dev - 0,03, / sys / fs / cgroup - 0,00.
08:50
Infra :: backup2.infra :: Использование inode в процентах. ОК: / run / user / 1001 равно 0,00, / tmp равно 0,02, / dev равно 0,03, / run / user / 0 равно 0,00, / dev / shm равно 0,00, / run - 0,05, / space - 0,24, / sys / fs / cgroup - 0,00, / mnt / usb1 - 0,51, / - 8,07, / home - 0,13, / space2 - 7,44, / run / lock - 0,00, / var - 2,02 , / export / oxa равно 0,01.
Infra :: backup2.infra :: Использование диска в процентах OKs: / - 18,46, / mnt / usb1 - 30,62, / sys / fs / cgroup - 0,00, / export / oxa - 51,62, / run / lock - 0,00, / var - 22,29, / space2 - 40,39, / home - 8,87, / tmp - 0,60, / run / user / 1001 - 0,00, / space - 76,49, / dev / shm - 0,00, / run - 9,27, / run / user / 0 составляет 0,00.
Все в порядке, в основных журналах ошибок нет, но я все равно получил много этих сообщений.
Вот журналы мастера об этом узле
munin-update.log: 2016/03/25 10:40:24 [ПРЕДУПРЕЖДЕНИЕ] Служба nfs4_client на backup2.infra / backup2.admin2: 4949 не вернула данных для метки fsinfo munin-update.log: 2016/03/25 10: 40:21 [ПРЕДУПРЕЖДЕНИЕ] Служба nfs_client на backup2.infra / backup2.admin2: 4949 не вернула данных для удаления метки
munin-update.log: 2016/03/25 09:55:06 [ИНФОРМАЦИЯ] начало работы в 29082 для backup2.infra / backup2.admin2: 4949. munin-update.log: 2016/03/25 09:55:06 [ИНФОРМАЦИЯ] узел backup2.infra вместо этого объявил себя резервным2. munin-update.log: 2016/03/25 09:55:12 [ИНФОРМАЦИЯ]: Munin-update завершен для узла inf; backup2.infra (6,67 сек) munin-update.log: 2016/03/25 09:55: 13 [ИНФОРМАЦИЯ] Жатва Munin :: Master :: UpdateWorker. Выходное значение / сигнал: 0/0
Конфигурация для уведомления
contact.devs.command mail -s "Munin notification ${var:host}" my@mail.com
contact.devs.always_send warning critical
Вот файл конфигурации для этого узла (сгенерированный, как и для всех узлов)
[backup2.infra]
address backup2.admin2
use_node_name yes
diskstats_latency.backup2_store_export.avgrdwait.warning :7
diskstats_latency.backup2_store_export.avgwrwait.warning :7
diskstats_latency.backup2_store_export.avgrdwait.critical :10
diskstats_latency.backup2_store_export.avgwrwait.critical :10
Munin Master и версия узла: 2.0.25-1 (оба Debian Jessie)
Где я могу посмотреть, чтобы понять и решить?
В df
плагин в Debian также проверяет динамически смонтированные файловые системы под /run/user/<uid>
которые появляются, когда пользователь входит в систему, и которые исчезают, когда пользователь выходит из системы. Несмотря на то, что все уровни в порядке, это появление и исчезновение считается изменением, которое запускает электронное письмо.
Вы можете избежать этого, создав файл с именем /etc/munin/plugin-conf.d/df
со следующим содержанием:
[df*]
env.exclude_re /run/user/
Чтобы проверить, работают ли ваши настройки, и указать, какие пути df
плагин считает, используйте следующую команду:
munin-run -d df
Если результат вас устраивает, перезапустите службу munin-node (service munin-node restart
).
Последние версии Munin в Debian и производных дистрибутивах должны обрабатывать это в соответствии с Ошибка Debian # 788736.
Некоторая логика в отношении монтирования типа tmpfs (что / run / user / *) был исправлен в проекте «Мунин апстрим». Насколько я понимаю, они не исключены. по умолчанию (возможно, это специфическая конфигурация Debian).
Для меня еще одной причиной этой ошибки были докеры.
В итоге я использовал эту конфигурацию, чтобы исправить как проблему @Oliver с / run / user, так и мою докерную;
[df*]
env.exclude_re ^(/run/user/|/var/lib/docker)