Назад | Перейти на главную страницу

LInux: Как мне диагностировать / определить причину «случайных» зависаний и самопроизвольных перезагрузок?

Итак, вместо того, чтобы гадать, в чем причина (хотя мои деньги идут на драйверы nvidia), с чего мне начать искать некоторые факты?

Я проходил через / var / log несколько раз, но там много всего, и я (пока) не могу определить важные моменты.


Предыстория: Краткая версия

Я перешел с WinXP на Ubuntu Karmic сразу после того, как он стал доступен.

С тех пор у меня была серия по-видимому случайные сбои, которые проявляются как:

Я провел много поисков, и Nvidia, кажется, является главным подозреваемым, но я не знаю, с чего начать, чтобы выяснить, в чем истинная причина.

Предложения?



Предыстория: длинная версия

Иногда я могу прожить целую неделю без сбоев, а затем получить 5 за 2 дня.

Стремясь устранить возможных подозреваемых, я безрезультатно внес несколько изменений:


Что касается того, что работает в то время, это может варьироваться. Следующие действия являются общими, но не обязательно выполняются при каждом сбое:


Моему оборудованию 2 - 3 года:


Я постоянно обновляю свою систему.

Надеюсь, что приведенные выше данные могут побудить кого-то предложить конкретный тип журнала или конфигурации, который стоит изучить.

Обновления
RAM в порядке
В соответствии с предложением ниже будет повторная публикация суперпользователя

Такие проблемы действительно могут быть вызваны неисправным оборудованием (если вы подозреваете драйвер nvidia, возможно, видеокарта имеет аппаратную ошибку?)

  • если у вас включен мониторинг температуры (с помощью сенсоров-апплетов / lm_sensors), есть ли высокие показания?
  • ты занимался разгоном?
  • Были ли у вас странные сбои / зависания / перезагрузки под Windows?

Если система зависает, необходимо проверить следующее:

  • светодиоды клавиатуры мигают? AFAIK, который указывает на панику ядра (например, сбой ядра)
  • вы можете связаться с системой с помощью Ping?
  • используйте комбинацию клавиш SysRq (должна быть включена заранее), чтобы узнать, можете ли вы получить ответ от системы
    • видеть http://en.wikipedia.org/wiki/Magic_SysRq_key для подробностей
    • вы должны убедиться, что клавиша действительно включена и работает, нажав Alt + SysRq + h на виртуальном терминале (переключитесь там с помощью Ctrl + Alt + F1; переключитесь обратно с помощью Ctrl + Alt + F7)
  • после перезагрузки проверьте файлы журнала (/ var / log / syslog, /var/log/Xorg.0.log) на наличие последних сообщений

Linux и другие Unix-подобные системы более чувствительны к нестабильному ОЗУ, чем Windows. Я бы запустил memtest86 и проверил оперативную память

Может это аппаратная проблема? У меня есть опыт работы со сломанной видеокартой, которая повесила компьютер, не оставив следов в журнале ядра. Чтобы изолировать проблему, попробуйте какой-нибудь LiveCD, который использует композитинг, или еще лучше: сыграйте в 3D-игру ;-). Видеть: соответствующий пост на форуме UL