Назад | Перейти на главную страницу

Какова стратегия обнаружения смещения времени в центре обработки данных на базе Linux?

Какова стратегия обнаружения дрейфа времени во всех центрах обработки данных на базе Linux? Это более сложная проблема, чем кажется на первый взгляд.

Дрейф времени может вызвать серьезные проблемы для определенных приложений, и часто, даже если установлен NTP, возможен сбой по следующим (и многим другим) причинам:

NTP не был правильно настроен для автоматического перезапуска при перезагрузке.
Настройки на сервере неверны, поэтому сервер времени, на который он указывает, недоступен или неточен.
Главный сервер времени недоступен, и все серверы синхронизируются с ним, теперь синхронизируются с ненадежным источником.

Мне нужен способ определить, все ли отдельные серверы верны. Имейте в виду, что сервер с тестовым скриптом / приложением может быть неправильным.

Это легко контролировать. Управление конфигурацией - это ключ ...

Убедитесь, что служба ntp запущена и настроена ...

Например, используя Монит Чтобы убедиться ntpd запущен, и перезапустить его в случае сбоя - простой подход ... Возможно, имеет смысл добавить cron и другие важные демоны для такого рода проверки.

Другой вариант - использовать управление конфигурацией инструмент как Кукольный для принудительного использования того же файла ntpd.conf на ваших серверах и обеспечения того, чтобы ntpd был установлен, настроен и запущен.

В протоколе NTP достаточно избыточности, чтобы иметь дело с экземпляром недоступного сервера времени. Укажите несколько источников.

Существует множество плагинов check_ntp для нагиос там.

Вот один:

http://nagiosplugins.org/man/check_ntp

Добавьте эту проверку на свой хост nagios и получайте предупреждения, если что-то пойдет не так.