Для плагинов Munin типа COUNTER и DERIVE, какие значения следует использовать для ${name}.warning
и ${name}.critical
ценности?
Это зависит от данных, которые вы измеряете (а не от типа данных).
СЧЕТЧИКИ - это абсолютные значения, поэтому вы просто указываете минимальное и максимальное значения, которые должны присутствовать. Типичный пример - количество пользователей, которые в настоящее время вошли в систему. (Обычно) нормально, чтобы никто не входил в систему, поэтому минимального порога не будет. На сервере обычно не бывает слишком много одновременно активных входов в систему, поэтому вы можете предупредить, если было пять активных входов, и выдать критическое предупреждение, если их было десять или больше. Это выглядело бы так:
users.warning :5
users.critical :10
Поля DERIVE представляют собой значения скорости изменения, поэтому вы просто учитываете минимальную и максимальную скорость, которую хотите увидеть. Предположим, вы отслеживаете электрическую мощность в ваттах (и это поле DERIVE, потому что система сообщает общее количество джоулей, которое она потребляет с момента включения, и вы получаете из этого значения ватты). Если система обычно потребляет 80 Вт, вы можете установить пороговые значения на 75 и 100 Вт для предупреждения и 70 и 130 Вт для критического состояния. (Если потребляемая мощность слишком низкая, вероятно, неисправен один из компонентов системы, так как большинство компьютеров имеют нижнюю границу нормального рабочего тока. С другой стороны, «слишком высокая» мощность будет зависеть от большего количества внешних факторов, таких как мощность вашей электрической инфраструктуры.) Это будет выглядеть так:
power.warning: 75:100
power.critical: 70:130
Я надеюсь, что я проиллюстрировал своими примерами, что настройки предела в значительной степени зависят от того, что именно вы измеряете, и нет общего способа сказать что-то вроде: «Источник данных DERIVE должен иметь порог предупреждения X: Y».
Насколько я могу судить, в Мунине есть ошибка для DERIVE. Вы можете настроить graph_period на минуту / час / день, но пределы критического удара / предупреждения всегда будут посекундными.