Прошлой ночью один из наших серверов Debian 7 неожиданно перестал работать.
Я никогда раньше не видел такого "краха", поэтому надеюсь, что кто-нибудь из присутствующих может дать мне ключ к разгадке того, что здесь произошло.
Информация о системе:
Теперь к проблеме: в какой-то момент сервер становился недоступным. После того, как ssh и ping не отвечают, я перезапустил сервер через кольцевой IPMI через 10 минут.
И все, что я нашел в журналах, было примерно таким:
Oct 30 03:51:53 box postfix/smtp[24856]: 6FE632E015F1: to=<XXXX@XXX.XX>, relay=mailload.mailmOct 30 04:05:03 box kernel: imklog 5.8.11, log source = /proc/kmsg started.
Oct 30 04:05:03 box rsyslogd: [origin software="rsyslogd" swVersion="5.8.11" x-pid="2804" x-info="http://www.rsyslog.com"] start
Как видите, сервер перестал записывать на диск в середине строки: ... mailmOct 30 ...
Состояние SMART и RAID-контроллера в порядке.