Мы используем check_postgres для мониторинга наших серверов PostgreSQL.
Иногда бывают пики количества блокировок и предупреждений о проверках.
До сих пор проверка сообщает нам только количество блокировок. Это не помогает при отладке источников блокировки.
Я хотел бы увидеть дополнительный результат. Например, этот вывод:
select * from pg_stat_activity order by datname
Вывод приведенного выше оператора длинный, и скрипты проверки AFAIK должны выводить только одну строку.
Как вывести дополнительную информацию, если проверка nagios / icinga не удалась?
Вы можете использовать Обработчик события сделать это.
Обработчик событий будет вызываться при любом изменении состояния, и вы пишете некоторую логику для запуска этого дополнительного select
когда это в CRITICAL
состояние (например, через ssh с ключами).
Это также позволяет вам делать с выводом все, что угодно, если он длинный. Вы можете записать его в файл, отправить по электронной почте, как угодно.