Я только начал использовать Nagios, и мне нравится, что моя команда может распознавать проблемы, но я еще не нашел способ регистрировать решения, которые используются для исправления проблем. Есть ли инструмент, который регистрирует предупреждения Nagios и предоставляет способ завершения вскрытия и регистрации решений, чтобы, когда кто-то сталкивается с подобными проблемами, он мог ссылаться на зарегистрированные данные?
Честно говоря, я не думаю, что попытка получить эту информацию во время сбоя полезна. Вы в стрессе, возможно, все еще хотите спать, по крайней мере, вы будете в режиме «бей или беги», который не способствует написанию хорошей документации. Nagios уже имеет возможность записывать быстрые заметки в сервисе (либо как часть подтверждения, либо как отдельная заметка, которую вы прикрепляете к сервису / хосту); их можно использовать как часть вскрытия, которое вы должны проводить на досуге после чрезвычайной ситуации, а затем включить в более структурированную, полезную и лучше написанную часть документации, которая записана в вики и связана с самой службой в Нагиосе (через notes_url
поле).
Взгляни на обработчики событий. Все, что вам нужно сделать, это написать сценарий для обработки событий и регистрации вашего решения в системе отслеживания проблем (мне нравится Redmine).
Там, где я работаю, мы делаем наоборот.
Мы используем систему продажи билетов TopDesk (неважно). Всякий раз, когда в Icinga появляется предупреждение (nagios-fork), он создает тикет через HTTP-запрос к TopDesk-серверу.
Итак, я думаю, что проще разрешить nagios рассылать предупреждения / ошибки по почте, смс и через систему продажи билетов, а затем использовать ее для отслеживания предпринятых действий.