Назад | Перейти на главную страницу

Вывести дополнительную информацию, если проверка nagios / icinga не удалась

Мы используем check_postgres для мониторинга наших серверов PostgreSQL.

Иногда бывают пики количества блокировок и предупреждений о проверках.

До сих пор проверка сообщает нам только количество блокировок. Это не помогает при отладке источников блокировки.

Я хотел бы увидеть дополнительный результат. Например, этот вывод:

select * from pg_stat_activity order by datname

Вывод приведенного выше оператора длинный, и скрипты проверки AFAIK должны выводить только одну строку.

Как вывести дополнительную информацию, если проверка nagios / icinga не удалась?

Вы можете использовать Обработчик события сделать это.

Обработчик событий будет вызываться при любом изменении состояния, и вы пишете некоторую логику для запуска этого дополнительного select когда это в CRITICAL состояние (например, через ssh с ключами).

Это также позволяет вам делать с выводом все, что угодно, если он длинный. Вы можете записать его в файл, отправить по электронной почте, как угодно.