Я столкнулся со следующей проблемой. Существует один сервер (DL160 G5), на котором работает Centos 6.3 с ядром по умолчанию 2.6.32-220.2.1.el6.x86_64 - на этом этапе я хотел бы добавить, что проблема появилась также в более старой версии - 6.1 и более раннем ядре (не запомните, какая именно версия). Установлена cPanel, и время от времени она становится недоступной (подключение к сети). Я проверил (через KVMoIP):
Обычно нормально работает через 1-15 минут. Что я могу еще проверить? Это определенно проблема ОС - при возникновении проблемы трафик на интерфейсе идет только в одном направлении, не может даже проверить петлю. Любые идеи? Рекомендуемые проверки? Ничего я выше не проверял.
Это маловероятно, но недавно у меня была проблема, при которой через случайные промежутки времени в некоторых системах наблюдалось очень большое время ЦП «СИСТЕМА», что было достаточно плохо, чтобы инструменты кластеризации считали систему мертвой и вызвали остановки и тому подобное.
Во время вашей проблемы попробуйте top
и ударил 1
, чтобы расширить процессоры и посмотреть, не показывают ли один или несколько процессоров странное поведение.
Вот как это могло бы выглядеть, если бы эта проблема возникла. Обратите внимание на высокое значение «sy».
Cpu0 : 16.7%us, 25.0%sy, 0.0%ni, 50.0%id, 0.0%wa, 0.0%hi, 8.3%si, 0.0%st
Cpu1 : 28.6%us, 42.9%sy, 0.0%ni, 28.6%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu2 : 6.0%us, 11.3%sy, 0.0%ni, 80.5%id, 0.0%wa, 0.0%hi, 2.3%si, 0.0%st
Cpu3 : 20.0%us, 60.0%sy, 0.0%ni, 20.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Вы также можете запустить dstat -talm
(возможно, в фоновом режиме и перенаправлении в файл), чтобы получить посекундную статистику, которая может помочь в диагностике проблемы, если вы не можете увидеть ее сразу после запуска.
Обратите внимание, что для решения моей проблемы я неделями работал с поддержкой Red Hat и, в конце концов, просто попытался установить более новую версию ядра с исправлениями, что и было решением.
CentOS или любой вариант Linux делают это не просто для развлечения. Есть основная проблема с оборудованием.
Я предполагаю, что ваш сервер - это VMware или другой виртуализированный гость, и проблема возникает во время создания гостевого снимка.
Ваш маркированный список был довольно длинным, но в нем не упоминались журналы. Что-нибудь интересное в dmesg
выход или под /var/log
?