У меня есть сервер, который работает более 5 месяцев, и внезапно он перестает отвечать. Я не мог использовать ssh или что-то еще, поэтому решил перезагрузить его, и перезагрузка исправила это.
Я пытаюсь понять, что произошло, и не знаю, где именно искать. Я начал смотреть в /var/log
но там куча файлов, и я не уверен, на какой из них следует обратить внимание. Я медленно прохожу каждую из них, но если бы кто-нибудь мог указать мне правильное направление, было бы здорово.
Спасибо!
Я бы начал с /var/log/messages
, который будет по умолчанию для большинства общих выходных данных. Он будет включать загрузочные сообщения и любые предупреждения ядра. В зависимости от типа проблемы данные судебно-медицинской экспертизы могут не остаться. Например, оперативная память может не вызывать ошибок. Ошибки диска будут в логах.
SSH мог просто сломаться. Не зная статуса на консоли, трудно сказать однозначно. Как правило, стабильный Linux-сервер, который не был изменен, внезапно блокируется, что может вызвать проблему с оборудованием. Большинство проблем с оборудованием требует дальнейшего поиска и устранения неисправностей и диагностики.
Если вы предоставите более подробную информацию, я, вероятно, смогу дать вам дальнейшие рекомендации.
Можете ли вы вставить вывод / var / log / messages, которые у вас есть, непосредственно перед перезагрузкой сервера?
Невозможно выяснить причину блокировки без проверки файлов журнала.
Также блокировка повторяется или это было разовое событие?
Может только sshd вышел из строя? Отвечает ли PING на сервер? Используйте «monit», если хотите, чтобы ваши сервисы (например, ssh, ftp, apache и т. Д.) Всегда работали.