Я настроил свой сервер Munin и оповещения, а также протестировал их. Я установил предупреждения об использовании диска, как показано ниже:
df._dev_mapper_centos_root.warning 90
df._dev_md126p2.warning 90
df._dev_md126p1.warning 90
df._dev_mapper_centos_home.warning 90
Я получил предупреждение для выше (для тестирования я оставил более низкие значения) на свой адрес электронной почты:
> sha :: Server2 :: Disk usage in percent
> WARNINGs: /boot is 33.48 (outside range [:33]), / is 17.95 (outside range [:17]), /boot/efi is 4.73 (outside range [:4]).
>
> sha :: Server1 :: Disk usage in percent
> OKs: /boot is 33.48, / is 17.95, /boot/efi is 4.73
Проблема, с которой я столкнулся сейчас, заключается в том, что я получаю предупреждения о задержке диска и не могу найти никаких значений для изменения предупреждений. Вот несколько предупреждений, запускаемых Munin:
> sha :: Server1 :: Disk latency per device :: Average latency
> for /dev/centos/swap
> WARNINGs: Write IO Wait time is 4.89 (outside range [0:3]).
>
> sha :: Server1 :: Disk latency per device :: Average latency
> for /dev/centos/home
> WARNINGs: Write IO Wait time is 10.64 (outside range [0:3])
.
Несмотря на то, что для этого сервера есть график задержки диска для каждого устройства, но когда я подключаюсь к узлу через telnet, у меня нет плагина для этого, чтобы получить значение:
telnet 192.168.10.252 4949
Trying 192.168.10.252...
Connected to 192.168.10.252.
Escape character is '^]'.
# munin node at localhost.localdomain
list
acpi cpu df df_inode entropy exim_mailqueue forks fw_conntrack
fw_forwarded_local fw_packets hddtemp_smartctl if_enp2s0 if_err_enp2s0
interrupts irqstats load memory netstat open_files open_inodes
postfix_mailqueue proc_pri processes swap threads uptime users vmstat
Я не уверен, правильно ли я объяснил это или нет, и извините, если вы думаете, что это глупый вопрос. Я просто хочу либо полностью отключить эти предупреждения, либо установить высокое значение. Надеюсь, мне здесь помогут.
Вероятно, это diskstats_latency плагин, попробуйте следующее:
diskstats_latency.centos_home.avgwrwait.warning 0:15
diskstats_latency.centos_home.avgrdwait.warning 0:15
diskstats_latency.centos_swap.avgwrwait.warning 0:15
diskstats_latency.centos_swap.avgrdwait.warning 0:15
Обратите внимание, что это как для записи (avgwrwait) и читать (avgrdwait) задержка.
Я установил диапазон 0:15, что почти полностью отключит предупреждения, как вы хотели.
Не забудьте перезапустить демон munin
systemctl restart munin-node