Назад | Перейти на главную страницу

Как вызвать предупреждение, если в журнале содержится количество секунд, превышающее пороговое значение?

У меня есть файл журнала, в котором приложение регистрирует время, необходимое для выполнения нескольких операций, связанных с другими подсистемами. Я хочу, чтобы Nagios (или другой) мог составлять график и отслеживать время в этом файле журнала.

Что было бы хорошим способом решить эту проблему?

Плагины проверки журналов, которые я нашел, работают с регулярными выражениями, но сравнение чисел с регулярными выражениями кажется ... не совсем стабильным.

Я мог бы изменить программу, чтобы она регистрировала время по-другому.

Спасибо

Я предполагаю, что вы имеете в виду http://exchange.nagios.org/directory/Plugins/Log-Files/check_logfiles/details . Как бы то ни было, я использую его для предупреждения о числовых интервалах с хорошим эффектом. Не знаю насчет графиков.

В общем-то говоря, Nagios используется для оповещения на основе некоторого текущего состояния, а что-то вроде кактусов используется для записи значений и сохранения их для исторического анализа. Nagios умеет делать некоторые простые графики трендов, но ничего по сравнению с cacti. Когда вы говорите, что хотите иметь возможность «строить диаграммы», это подразумевает расширенные исторические графики / анализ, а это означает кактусы. (Или другое подобное решение по вашему выбору.)

При этом я лично выбрал бы подход, который не обязательно будет самым простым, но может оказаться наиболее полезным в будущем. Это двухэтапный процесс. Первый шаг - разработать метод извлечения значения из файла журнала. Второй шаг - передать это значение в систему отслеживания.

В качестве первого шага я бы предложил настроить net-snmp на сервере, где хранится файл журнала. Напишите сценарий или найдите тот, который уже был написан, который может извлекать значение из файла журнала именно так, как вы хотите его сохранить. Затем вы можете настроить snmpd для запуска этого сценария за вас и возврата значения с указанным вами пользовательским OID.

На втором этапе вы направите свой инструмент построения графиков (кактусы) на связь с рассматриваемым сервером и запросите конкретный OID, который, в свою очередь, вызовет скрипт и вернет значение. Это будет отображено в вашем историческом графическом решении.

Если вы говорите о мониторинге текущего состояния последней записи в файле журнала, вы говорите о Nagios. Напишите свой собственный сценарий, как указано выше, но этот сценарий становится подключаемым модулем Nagios, который запускается, скажем, nrpe.

Этот подход, основанный на snmp, требует предварительной работы, но он может принести большую пользу в будущем, поскольку вы можете начать отслеживать всевозможные пользовательские значения в своей среде и строить их графики.

Надеюсь это поможет.