Назад | Перейти на главную страницу

Пределы Мунина для данных COUNTER и DERIVE

Для плагинов Munin типа COUNTER и DERIVE, какие значения следует использовать для ${name}.warning и ${name}.critical ценности?

Это зависит от данных, которые вы измеряете (а не от типа данных).

СЧЕТЧИКИ - это абсолютные значения, поэтому вы просто указываете минимальное и максимальное значения, которые должны присутствовать. Типичный пример - количество пользователей, которые в настоящее время вошли в систему. (Обычно) нормально, чтобы никто не входил в систему, поэтому минимального порога не будет. На сервере обычно не бывает слишком много одновременно активных входов в систему, поэтому вы можете предупредить, если было пять активных входов, и выдать критическое предупреждение, если их было десять или больше. Это выглядело бы так:

users.warning :5
users.critical :10

Поля DERIVE представляют собой значения скорости изменения, поэтому вы просто учитываете минимальную и максимальную скорость, которую хотите увидеть. Предположим, вы отслеживаете электрическую мощность в ваттах (и это поле DERIVE, потому что система сообщает общее количество джоулей, которое она потребляет с момента включения, и вы получаете из этого значения ватты). Если система обычно потребляет 80 Вт, вы можете установить пороговые значения на 75 и 100 Вт для предупреждения и 70 и 130 Вт для критического состояния. (Если потребляемая мощность слишком низкая, вероятно, неисправен один из компонентов системы, так как большинство компьютеров имеют нижнюю границу нормального рабочего тока. С другой стороны, «слишком высокая» мощность будет зависеть от большего количества внешних факторов, таких как мощность вашей электрической инфраструктуры.) Это будет выглядеть так:

power.warning: 75:100
power.critical: 70:130

Я надеюсь, что я проиллюстрировал своими примерами, что настройки предела в значительной степени зависят от того, что именно вы измеряете, и нет общего способа сказать что-то вроде: «Источник данных DERIVE должен иметь порог предупреждения X: Y».

Насколько я могу судить, в Мунине есть ошибка для DERIVE. Вы можете настроить graph_period на минуту / час / день, но пределы критического удара / предупреждения всегда будут посекундными.