У меня 2 сервера, один сообщает о времени безотказной работы 9 часов, другой 7 часов. У меня нет другой системы мониторинга. Мой "хостинг-провайдер" говорит, что это был единичный скачок мощности, который перезапустил оба, и что время безотказной работы нельзя считать точным. Есть ли способ, которым он прав? Могут ли 2 сервера, перезагруженных одновременно, показывать разницу во времени безотказной работы в 2 часа? Спасибо.
Можно ли доверять значению времени безотказной работы linux для определения времени простоя?
Нет.
/proc/uptime
и / или uptime
команда только сообщает вам, как долго работает система, то есть позволяет определить, как долго система восстановлен от сбоя.
Даже если у вас нет мониторинга last -F reboot
или быстрый осмотр /var/log/messages
обычно показывает промежуток времени между последними записанными сообщениями и восстановлением системы, что позволяет (приблизительно) оценить продолжительность сбоя.
Uptime - это AFAIK простой постоянно увеличивающийся счетчик ядра, на который не влияют манипуляции с датой / временем системных часов. Т.е. при изменении часовых поясов или изменении системного времени / даты, например, с помощью NTP, date
командовать или управлять (неправильными) аппаратными часами с помощью hwclock
, это не изменит счетчик времени безотказной работы.
Если время безотказной работы ваших систем отличается на два часа, и у них такой же сбой, наиболее очевидный вывод - восстановление после этого сбоя заняло дополнительные два часа для одной из этих систем ...
Между прочим, существует множество потенциально вполне веских причин.
uptime
действительно только в том случае, если вы хотите знать время, в течение которого система работала с момента последнего запуска, не более того.
Вместо, tuptime
вести учет событий запуска и выключения системы. Это полезно для отображения аварийных отключений, например, вызванных отключениями электроэнергии и зависаниями, потому что в их отчете в столбце End указано, было ли это нормально или плохо:
$ tuptime -t
No. Startup Date Uptime Shutdown Date End Downtime
1 22:21:49 05/15/18 50 minutes and 44 seconds 23:12:33 05/15/18 OK 13 seconds
2 23:12:46 05/15/18 1 minute and 2 seconds 23:13:48 05/15/18 OK 18 hours, 57 minutes and 18 seconds
3 18:11:06 05/16/18 2 minutes and 34 seconds 18:13:40 05/16/18 BAD 1 hour, 48 minutes and 6 seconds
4 20:01:46 05/16/18 1 hour, 29 minutes and 30 seconds 21:31:15 05/16/18 BAD 14 minutes and 31 seconds
5 21:45:47 05/16/18 19 minutes and 42 seconds 22:05:28 05/16/18 OK 21 hours, 7 minutes and 18 seconds
6 19:12:47 05/17/18 37 minutes and 1 second 19:49:47 05/17/18 OK 26 seconds