У меня сейчас странная проблема в том, что мой WIND BOX DE500-5123L Atom D510 320GB 2048MB DVD SM HD4330
иногда вылетает, и я не знаю, с чего начать.
Ядро Linux 2.6.26-2-vserver-686 #1 SMP Thu May 13 01:30:39 UTC 2010 i686 GNU/Linux
(просто чистый Debian).
Журнал ядра мне ничего подозрительного не сообщает:
02:30:01 CRON[15102]: pam_unix(cron:session): session opened for user root by (uid=0)
02:30:01 /USR/SBIN/CRON[15104]: (root) CMD (if [ -x /etc/munin/plugins/apt_all ]; then /etc/munin/plugins/apt_all update 7200 12 >/dev/null; elif [ -x /etc/munin/plugins/apt ]; then /etc/munin/plugins/apt update 7200 12 >/dev/null; fi)
02:30:01 CRON[15102]: pam_unix(cron:session): session closed for user root
02:31:01 kernel: [ 1974.992964] vxW: [<BB>ck-collect-sess<AB>,15715:#400|400|400] did lookup hidden f70b449c[#0,5] <BB>/dev/pts<AB>.
02:31:32 kernel: [ 2028.565867] vxW: [<BB>console-kit-dae<AB>,6459:#400|400|400] did lookup hidden f70b449c[#0,5] <BB>/dev/pts<AB>.
02:34:27 sshd[6137]: syslogin_perform_logout: logout() returned an error
02:34:27 sshd[6137]: pam_unix(sshd:session): session closed for user user
02:35:01 CRON[15865]: pam_unix(cron:session): session opened for user root by (uid=0)
02:35:01 /USR/SBIN/CRON[15866]: (root) CMD (if [ -x /etc/munin/plugins/apt_all ]; then /etc/munin/plugins/apt_all update 7200 12 >/dev/null; elif [ -x /etc/munin/plugins/apt ]; then /etc/munin/plugins/apt update 7200 12 >/dev/null; fi)
02:35:01 CRON[15865]: pam_unix(cron:session): session closed for user root
18:31:34 kernel: imklog 3.18.6, log source = /proc/kmsg started.
Он внезапно просто мертв. Когда я пришел домой, машина действительно была выключена.
Установил munin и проверил графики, но что-то с прыгало прямо мне. Я только помню, что я начал работу по компиляции Ruby, которая занимает довольно много времени на машине (поэтому нагрузка такая высокая).
Датчики Munin:
Вот нагрузка:
Использование диска ОК, везде достаточно места. Я использую около 6 виртуальных машин с linux-vserver, которые делают такие вещи, как DNS (внутренний), MTA / IMAP, сканирование на вирусы, некоторые HTTP. Кроме SMTP, нет ничего общедоступного (машина Linux находится за маршрутизатором Netgear, а также выбранные порты перенаправляются).
Я буду рад предоставить дополнительную информацию и обновлю вопрос.
Похоже, на самом деле виновата температура: я открыл систему, удалил всю пыль (а ее было много) и перезапустил: сразу видно падение температуры:
Теперь я подозревал температуру, но на самом деле думал, что все в порядке. Я думаю, что нашел спецификации материнской платы на http://www.intel.com/Assets/PDF/prodbrief/322518.pdf и он говорит:
Environment:
Operating Temperature
• 0°C to +50°C
Storage Temperature
• -20°C to +70°C
Рабочая температура уже будет выше, а температура хранения - нет. Но я понятия не имею, в чем разница между ними.
Теперь я предполагаю, что система обнаружила перегрев, и просто немедленно выключила компьютер (не давая ОС возможности должным образом выключиться). Ничего не нашел в биосе, указывающего на это, может выключение тоже было вынужденный.
Теперь система работает стабильно, и мне нужно следить за температурой и пылью вокруг системы.