Я запускаю CentOS 5.5 на сервере. Он запускает несколько виртуальных машин VMware и сервер NFS.
Иногда, как сегодня, зависает. В / var / log / messages нет ничего, что указывало бы на какие-либо проблемы. (Я заметил, что / var / log / messages не во времени.)
Есть предложения, где искать причину?
Проблема заключалась в сбое ОЗУ. Запустил memtest86 и обнаружил сбои. RMA забрал модули DIMM и получил новые. У некоторых из них также были сбои памяти. РМА и те, теперь все стабильно.
Это не так уж много информации для диагностики. Если система действительно зависает, то есть перестает отвечать в сети и на локальной консоли, а в системном журнале нет ничего dmesg
чтобы дать подсказку, я бы предположил, что вы столкнулись с аппаратной неисправностью, и начнете использовать диагностические инструменты от вашего поставщика оборудования. Плохая ОЗУ или ЦП, безусловно, может вызвать такое поведение.
Не обязательно, что syslog имеет возможность асинхронно записывать сообщения журнала. Также посмотрите вывод sar, чтобы узнать, в чем дело. Это может быть ожидание ввода-вывода, машина может быть привязана к сети, памяти или ЦП.
Если вы используете оконный менеджер (gnome или kde), я видел проблемы с жесткой блокировкой компьютеров.
Проблема заключалась в том, что заставка gnome вызвала некоторую проблему, когда машина просто полностью зависала и перестала отвечать на любое соединение. После отключения заставки зависания прекратились.
Взгляните на журналы xorg и журналы gdm (если вы используете gnome).
Также проверьте отметки времени во всех ваших файлах журналов в / var / logs и посмотрите, записываются ли какие-либо журналы во время блокировки.
Вы смотрели cron? Может ли процесс запускаться автоматически и вызывать блокировку?
Возможно, вам просто нужно полностью очистить материнскую плату. То же самое происходило и со мной; полное замораживание; полное зависание, без каких-либо журналов, без ответа на мышь или клавиатуру, просто зависший экран и зависший процессор, полностью не отвечает. Логи ничего не показали.
Я сделал полную чистку, которая включила вытаскивание материнской платы, отключение всего. Очень и очень бережная уборка. Снятие радиатора процессора, который был прикреплен к внутреннему вентилятору, означало, что мне пришлось переставить поверхность радиатора на верхнюю часть процессора, используя термопасту artic silver 5, которую я купил в моей местной радиорубке.
Я также использовал чистый медицинский спирт (91%), чтобы очистить старую термопасту с процессора и радиатора.
Я скачал инструкции от Intel и Artic Silver.
Он должен быть очень и очень чистым, есть очень конкретные инструкции.
Сложите все вместе, в соответствии с инструкциями, которые я скачал, все прошло нормально.
Спас меня от того, чтобы выбросить ПК, думая, что с ним что-то физически не так, когда он был просто грязным и пыльным. Под кожухом вентилятора на материнской плате был действительно неприятный беспорядок. Это должно было вызвать короткое замыкание, поскольку пыль и грязь / мусор являются электропроводными.