Назад | Перейти на главную страницу

Уровни важности системного журнала, когда использовать оповещение или критическое

Краткий обзор: Предупреждение более серьезное, чем критическое.

RFC 5424 кратко определяет уровни серьезности системного журнала и дает краткое описание. Каждому уровню системного журнала присваивается код от 0 до 7. Насколько я понимаю, 0 (Emergency) был самым серьезным, а 7 (Debug) - самым низким.

Однако я ставлю под сомнение 1 (предупреждение) и 2 (критическое состояние). Определения в RFC 5424:

Однако на этот сайт они дают более подробное описание (что, очевидно, является личным мнением), но определяют их как:

Это кажется обратным, поскольку подразумевает, что Critical более серьезен, чем Alert, хотя RFC 5424, кажется, помещает Alert как более серьезный. Мне просто интересно, есть ли официальная позиция по этому поводу или какие-либо передовые методы?

Критическое означает, что вот-вот произойдет что-то плохое. Предупреждение означает, что что-то плохое уже произошло.

Взгляни на Создание масштабируемых решений для управления системным журналом на Cisco.com, где вы можете прочитать об управлении системным журналом.

Я думаю, что эти примеры означают, что если срабатывает статус Alert, то Critical уже произошло. В этом примере указано, что критическим является выход из строя основного интернет-провайдера, а когда отключается резервный интернет-провайдер, появляется предупреждение. (Таким образом, основной и резервный интернет-провайдеры не работают). Сбой резервного интернет-провайдера сам по себе, вероятно, не является предупреждением, потому что основной интернет-провайдер все еще работает. (Может быть, критический). Точно так же выход из строя основного интернет-провайдера является только критическим, а не предупреждением, потому что система все равно будет работать, хотя и на резервном интернет-провайдере. (Все еще важно исправить как можно скорее.)

Я думаю, что авторы системного журнала нечаянно переключили критическое состояние на предупреждение. С точки зрения языка, бдительность сродни предупреждению; обратите внимание »(« БОЛО »в криминальных сериалах - хорошая аналогия),« критический »сродни« решить эту проблему как можно скорее », а« чрезвычайная ситуация »сродни« бросьте то, что вы делаете, и исправьте это СЕЙЧАС ».

Следующая гипотетическая ситуация может лучше проиллюстрировать использование предупреждений и критических ошибок.

  • 2013/1/1: Критическое состояние: диск 0 md0 (RAID-1) показывает чрезмерную температуру (55 ° C)
  • 2013/1/5: Критическое состояние: диск 0 md0 (RAID-1) показывает увеличение количества сбойных секторов (34-> 147)
  • 2013/1/6: Критическое состояние: неисправен диск 0 md0 (RAID-1).
  • 2013/1/6: Предупреждение: диск 1 md0 (RAID-1) показывает чрезмерную температуру (53 ° C)
  • 2013/1/7: Авария: диск 1 md0 (RAID-1) показывает увеличение количества сбойных секторов (12-> 18)

Проблемы с диском 0 критичны только потому, что его зеркало в порядке. Проблема перегрева привода 1 является предупреждением, потому что только диск в RAID не работает; количество сбойных секторов является чрезвычайной ситуацией, потому что у диска есть две проблемы, и это единственный диск, оставшийся в массиве.

Увы, syslog сейчас слишком укоренился, чтобы изменить порядок этих двух меток.