Какова стратегия обнаружения дрейфа времени во всех центрах обработки данных на базе Linux? Это более сложная проблема, чем кажется на первый взгляд.
Дрейф времени может вызвать серьезные проблемы для определенных приложений, и часто, даже если установлен NTP, возможен сбой по следующим (и многим другим) причинам:
Мне нужен способ определить, все ли отдельные серверы верны. Имейте в виду, что сервер с тестовым скриптом / приложением может быть неправильным.
Это легко контролировать. Управление конфигурацией - это ключ ...
Убедитесь, что служба ntp запущена и настроена ...
Например, используя Монит Чтобы убедиться ntpd
запущен, и перезапустить его в случае сбоя - простой подход ... Возможно, имеет смысл добавить cron и другие важные демоны для такого рода проверки.
Другой вариант - использовать управление конфигурацией инструмент как Кукольный для принудительного использования того же файла ntpd.conf на ваших серверах и обеспечения того, чтобы ntpd был установлен, настроен и запущен.
В протоколе NTP достаточно избыточности, чтобы иметь дело с экземпляром недоступного сервера времени. Укажите несколько источников.
Существует множество плагинов check_ntp для нагиос там.
Вот один:
http://nagiosplugins.org/man/check_ntp
Добавьте эту проверку на свой хост nagios и получайте предупреждения, если что-то пойдет не так.