Назад | Перейти на главную страницу

Внезапная паника ядра на сервере Linux

Несколько дней назад на сервере, которым я управляю, случилась паника после 400+ дней безотказной работы. Я перезагрузил его, и он проработал два дня или около того, а затем получил сообщение «oops: cpu # n stuck for 61s» для различных значений n. Снова перезагрузился, и сегодня снова появилась оригинальная ошибка ядра. Трассировка (повторный набор вручную, пропуск адресов):

Kernel panic - not syncing: Fatal exception in interrupt
Pid: 0, comm: swapper Tainted: G        D    2.6.32-41-server #89-Ubuntu
Call Trace:
 <IRQ> panic
 oops_end
 die
 do_general_protection
 ? consume_skb
 general_protection
 ? put_page
 skb_release_data
 __kfree_skb
 consume_skb
 dev_kfree_skb_any
 sky2_tx_complete
 sky2_status_intr
 ? __queue_work
 sky2_poll
 net_rx_action
 __do_softirq
 ? handle_IRQ_event
 call_softirq
 do_softirq
 irq_exit
 do_IRQ
 ret_from_intr
 <EOI> ? mwait_idle
 ? atomic_notifier_call_chain
 ? cpu_idle
 ? start_secondary

RIP put_page

Операционная система - Ubuntu 10.04.4 x64. Так как он всегда работал и до паники ничего не менялось, я думаю о какой-то аппаратной неисправности. Перед последней перезагрузкой я провел полный мемтест, и он прошел, а также полный fsck на всякий случай. Поскольку паника связана с sky2 (сетевой контроллер Marvell), это может быть проблемой? Что-то я упустил? Учтите, что между ошибками все работает отлично (нет ошибок в журналах, нет отброшенных пакетов, нет замедлений).

Спасибо за любой указатель

Вероятна проблема с оборудованием. Забитые и / или вышедшие из строя вентиляторы, слишком высокая температура, плохая оперативная память, плохой процессор, неисправный блок питания, срок службы материнской платы подходит к концу ....