Назад | Перейти на главную страницу

Можно ли доверять значению времени безотказной работы linux для определения времени простоя?

У меня 2 сервера, один сообщает о времени безотказной работы 9 часов, другой 7 часов. У меня нет другой системы мониторинга. Мой "хостинг-провайдер" говорит, что это был единичный скачок мощности, который перезапустил оба, и что время безотказной работы нельзя считать точным. Есть ли способ, которым он прав? Могут ли 2 сервера, перезагруженных одновременно, показывать разницу во времени безотказной работы в 2 часа? Спасибо.

Можно ли доверять значению времени безотказной работы linux для определения времени простоя?

Нет.

/proc/uptime и / или uptime команда только сообщает вам, как долго работает система, то есть позволяет определить, как долго система восстановлен от сбоя.

Даже если у вас нет мониторинга last -F reboot или быстрый осмотр /var/log/messages обычно показывает промежуток времени между последними записанными сообщениями и восстановлением системы, что позволяет (приблизительно) оценить продолжительность сбоя.

Uptime - это AFAIK простой постоянно увеличивающийся счетчик ядра, на который не влияют манипуляции с датой / временем системных часов. Т.е. при изменении часовых поясов или изменении системного времени / даты, например, с помощью NTP, date командовать или управлять (неправильными) аппаратными часами с помощью hwclock , это не изменит счетчик времени безотказной работы.

Если время безотказной работы ваших систем отличается на два часа, и у них такой же сбой, наиболее очевидный вывод - восстановление после этого сбоя заняло дополнительные два часа для одной из этих систем ...

Между прочим, существует множество потенциально вполне веских причин.

uptime действительно только в том случае, если вы хотите знать время, в течение которого система работала с момента последнего запуска, не более того.

Вместо, tuptime вести учет событий запуска и выключения системы. Это полезно для отображения аварийных отключений, например, вызванных отключениями электроэнергии и зависаниями, потому что в их отчете в столбце End указано, было ли это нормально или плохо:

$ tuptime -t
No.        Startup Date                                Uptime       Shutdown Date   End                                       Downtime

1     22:21:49 05/15/18             50 minutes and 44 seconds   23:12:33 05/15/18    OK                                     13 seconds
2     23:12:46 05/15/18                1 minute and 2 seconds   23:13:48 05/15/18    OK            18 hours, 57 minutes and 18 seconds
3     18:11:06 05/16/18              2 minutes and 34 seconds   18:13:40 05/16/18   BAD               1 hour, 48 minutes and 6 seconds
4     20:01:46 05/16/18     1 hour, 29 minutes and 30 seconds   21:31:15 05/16/18   BAD                      14 minutes and 31 seconds
5     21:45:47 05/16/18             19 minutes and 42 seconds   22:05:28 05/16/18    OK             21 hours, 7 minutes and 18 seconds
6     19:12:47 05/17/18               37 minutes and 1 second   19:49:47 05/17/18    OK                                     26 seconds