Назад | Перейти на главную страницу

Есть какие-нибудь хорошие плагины nagios для rsnapshot?

Я использую Nagios для мониторинга серверов, а мы используем rsnapshot для резервного копирования. Мне нужен плагин для Nagios, который отслеживает успешный запуск rsnapshot. Я видел несколько подключаемых модулей rsnapshot, которые выполняют полную проверку дерева каталогов, что для меня слишком неэффективно.

Есть ли какие-нибудь, которые выполняют простые проверки того, что последний запуск прошел нормально (например, просматривает файлы журнала) или что все каталоги есть?

Рори, мы только что выпустили плагин, который должен работать на вас. Увидеть check_rsnapshot.php файл в nagios-tools пакет, а также документация Вот.

Этот плагин будет проверять резервные копии rsnapshot, используя ряд дополнительных проверок:

  • minfiles - сравнивает количество файлов в снимке с минимальным ожидаемым числом;
  • миниатюрный - сравнивает размер снимка с минимальным ожидаемым размером; log - анализирует журнал rsnapshot, чтобы убедиться, что самые последние запуски для каждого периода хранения завершились успешно;
  • отметка времени - проверяет файлы, созданные на стороне сервера, содержащие метку времени и, таким образом, гарантируя, что моментальные снимки будут успешными;
  • вращение - проверяет ротацию директорий хранения; и
  • создание каталога - проверяет, создаются ли каталоги хранения.

Я не могу ответить по поводу rsnapshot, но использую аналогичный инструмент rdiff.

Есть несколько вещей, которые я отслеживаю с помощью nagios для своих резервных копий:

  • каков был код выхода последнего запуска rdiff. если не 0 - значит, в процессе что-то пошло не так. У меня просто есть простой сценарий bash, который выполняет bacup и в зависимости от результата касается файла нормально или не работает. с помощью nagios я проверяю свежесть файла OK и предупреждаю, если он старше 25 часов.
  • перед запуском резервного копирования я касаюсь файла в / xyz / touch. на сервере, который получает резервную копию, я проверяю актуальность этого файла. если он старше 25 часов, это означает, что резервная копия прошлой ночью не пришла на принимающую машину.
  • У rdiff есть опция проверки. я не знаю, есть ли у rsnapshot. проверка занимает много времени, я запускаю ее один раз в день и помещаю результат в файл ... затем простой плагин nagios ищет этот файл журнала в поисках сообщений об ошибках.

таким образом я защищаю себя от прерывания резервного копирования и от повреждения файловой системы на принимающем сервере (для файлов, которые не изменялись долгое время).

Хитрость заключается в том, чтобы не позволять плагину nagios выполнять тяжелую работу (например, проверять всю резервную копию), а скорее планировать задание cron, которое это делает, и иметь плагин nagios, просто проверяющий результат задания (например, созданный файл или содержимое файла журнала).

и кстати - проверьте этот вне.