Несколько дней назад на сервере, которым я управляю, случилась паника после 400+ дней безотказной работы. Я перезагрузил его, и он проработал два дня или около того, а затем получил сообщение «oops: cpu # n stuck for 61s» для различных значений n. Снова перезагрузился, и сегодня снова появилась оригинальная ошибка ядра. Трассировка (повторный набор вручную, пропуск адресов):
Kernel panic - not syncing: Fatal exception in interrupt
Pid: 0, comm: swapper Tainted: G D 2.6.32-41-server #89-Ubuntu
Call Trace:
<IRQ> panic
oops_end
die
do_general_protection
? consume_skb
general_protection
? put_page
skb_release_data
__kfree_skb
consume_skb
dev_kfree_skb_any
sky2_tx_complete
sky2_status_intr
? __queue_work
sky2_poll
net_rx_action
__do_softirq
? handle_IRQ_event
call_softirq
do_softirq
irq_exit
do_IRQ
ret_from_intr
<EOI> ? mwait_idle
? atomic_notifier_call_chain
? cpu_idle
? start_secondary
RIP put_page
Операционная система - Ubuntu 10.04.4 x64. Так как он всегда работал и до паники ничего не менялось, я думаю о какой-то аппаратной неисправности. Перед последней перезагрузкой я провел полный мемтест, и он прошел, а также полный fsck на всякий случай. Поскольку паника связана с sky2 (сетевой контроллер Marvell), это может быть проблемой? Что-то я упустил? Учтите, что между ошибками все работает отлично (нет ошибок в журналах, нет отброшенных пакетов, нет замедлений).
Спасибо за любой указатель
Вероятна проблема с оборудованием. Забитые и / или вышедшие из строя вентиляторы, слишком высокая температура, плохая оперативная память, плохой процессор, неисправный блок питания, срок службы материнской платы подходит к концу ....