В настоящее время мы используем vFabric Hyperic 4.5.2.2 для мониторинга ряда систем.
Предупреждения и тому подобное были настроены до того, как я присоединился к этой команде, но я искал способы их улучшить, а именно минимизировать влияние мониторинга на рабочие серверы без ущерба для достаточного покрытия.
Я заметил, что периодически Hyperic просто забивает серверы, иногда загружая процессор на максимум от 30 секунд до минуты.
Хотя я знаю, что уменьшение количества мониторов / предупреждений поможет, я не смогу сделать это, пока не будут внесены некоторые другие изменения в архитектуру системы и макет.
Между тем, есть ли способ запланировать выполнение запросов страниц или заставить их сдвигаться? Я нашел, как изменить интервал сбора, но это не решает основную проблему.
Кроме того, я не уверен, что проблемы вызывают только мониторы HTTP, хотя я почти уверен, что они вносят свой вклад.
Мне удалось найти файл server.log, но в нем либо отсутствует информация (возможно, из-за уровня ведения журнала?), Либо я не знаю, что ищу.
У меня есть более сложный вопрос: как я могу определить, что делает Hyperic, из-за чего отслеживаемые серверы иногда почти блокируются? Это, конечно, может привести к другим вопросам, но я могу ответить на них по мере их возникновения.
Я посмотрел ответы на этот вопрос но наш Hyperic не настроен на сканирование журналов.
Спасибо.
У меня была аналогичная проблема с гипериком 4.1.1. После двух с лишним лет работы мы начали наблюдать высокую загрузку процессора.
Мы изолировали проблему от агента. В нашем случае мы использовали агент со встроенным jre.
Мы установили v6 build 35 jre и установили HQ_JAVA_HOME:
(Примечание: не устанавливайте эту переменную в каталог java bin. Скорее установите его в базовый каталог jre6, в Windows обычно это: c: \ program files \ java \ jre6)
Мы перезапустили агента, и на земле мир!