Я немного запутался сейчас, у меня только что ложная тревога
У меня был элемент, настроенный для мониторинга входящего и исходящего трафика на моих серверах, и, несмотря на то, что он работал так, как предполагалось в течение ВСЕГО МЕСЯЦА, внезапно я получаю пик, меньший, чем несколько других, который вызывает предупреждение, вот график, показывающий, что вызвало предупреждение (18 сентября, в 9:00)
Когда это предупреждение было запущено, моя функция триггера была настроена как
{Basic Monitoring:net.if.in[eth0,bytes].avg(60)}>20M
Поэтому я увеличил значения до:
{Basic Monitoring:net.if.in[eth0,bytes].avg(120)}>25M
Однако я немного беспокоюсь, что это может повториться, то есть я не понял или неправильно настроил элемент / триггер.
Вот мой элемент и функция, используемые для этого предупреждения
Почему и как это произошло?
Ваш элемент получает данные каждые 5 секунд (что, кстати, очень часто, рассмотрите возможность использования более длительного интервала), ваш триггер используется для проверки среднего значения за 60 секунд. Не оценивая каждое отдельное значение данных, я бы предположил, что предыдущие пики были короче, а предупреждающий просто был там немного дольше - чтобы увеличить среднее значение на 60 секунд за порог.
По аналогичной причине значения могут отсутствовать несколько раз. Например, если только одно значение за 60 секунд превышает пороговое значение, то среднее значение также немедленно возрастет.