Примерно три раза в месяц (с разной периодичностью) я теряю связь с одним из моих (аппаратно очень старых) серверов. Он просто перестает отвечать на любые сетевые запросы, и даже прямое подключение монитора и клавиатуры не вызывает никакой реакции, машина кажется полностью мертвой. Однако вентиляторы все еще работают, а светодиоды показывают нормальное поведение.
На машине работает openSUSE 13.2, и я не могу найти никаких признаков проблем в файлах журнала. Последний journalctl
записи перед ручной перезагрузкой, которую я должен выполнить, содержат только периодическое ведение журнала cron:
Aug 08 08:55:37 linux-swnh systemd-journal[160]: Runtime journal is using 8.0M (max allowed 702.9M, trying to leave 1.0G free of 6.8G available → current limit 702
-- Reboot --
Aug 07 23:15:02 othello systemd[4477]: pam_unix(systemd-user:session): session closed for user root
Aug 07 23:15:02 othello CRON[4475]: pam_unix(crond:session): session closed for user root
Aug 07 23:15:01 othello systemd[4476]: pam_unix(systemd-user:session): session opened for user root by (uid=0)
Aug 07 23:15:01 othello cron[4475]: pam_unix(crond:session): session opened for user root by (uid=0)
Нет других входов в систему /var/log
были написаны до последней потери. Есть ли другое место, где я могу найти указание на ошибку или какие-то тесты, которые нужно запустить? Поскольку оборудование, на котором работает эта машина, довольно старое, я не исключаю наличие каких-либо проблем.