Возможный дубликат:
Кто-нибудь еще сталкивался с высокими показателями сбоев сервера Linux в течение второго дня?
У нас есть два сервера, которые не работают. Один - это виртуальная машина, а другой - «голый металл». Ни у одного из них нет похожего кода, но они находятся в одной сети. Похоже, невероятное количество переключений контекста возникает из-за ksoftirqd (который занимает много ЦП).
вывод vmstat
procs -----------memory---------- ---swap-- -----io---- -system-- -----cpu------
r b swpd free buff cache si so bi bo in cs us sy id wa st
1 0 0 605092 182496 2637556 0 0 0 0 4177 519187 8 19 73 0 0
2 0 0 605092 182496 2637556 0 0 0 0 4792 520980 8 19 74 0 0
3 0 0 605092 182496 2637552 0 0 0 0 2137 659640 18 26 56 0 0
...
вывод pidstat
TCK4-BM-06A:~ # pidstat -w -I 5
Linux 2.6.32.12-0.7-default (TCK4-BM-06A) 07/02/2012 _x86_64_
03:03:01 PM PID cswch/s nvcswch/s Command
03:03:06 PM 1 0.20 0.00 init
03:03:06 PM 4 386666.27 0.00 ksoftirqd/0
03:03:06 PM 6 0.60 0.00 ksoftirqd/1
03:03:06 PM 8 378213.17 0.00 ksoftirqd/2
03:03:06 PM 10 0.20 0.00 ksoftirqd/3
03:03:06 PM 12 0.20 0.00 ksoftirqd/4
03:03:06 PM 26 377115.37 0.00 ksoftirqd/11
03:03:06 PM 27 1.80 0.00 events/0
03:03:06 PM 28 1.00 0.00 events/1
03:03:06 PM 29 1.00 0.00 events/2
03:03:06 PM 30 1.00 0.00 events/3
03:03:06 PM 31 0.80 0.00 events/4
03:03:06 PM 32 0.80 0.00 events/5
...
Моя первоначальная мысль заключается в том, что, поскольку оба находятся в одной сети, что-то наводняет сеть. Соответствует ли это данным?
См. Вопрос о дополнительной секунде и обходные пути по адресу: Кто-нибудь еще сталкивался с высокими показателями сбоев сервера Linux в течение второго дня?
Вы испытываете один из симптомов.