Назад | Перейти на главную страницу

Linux Centos 6 время от времени становится недоступен - проблема с ОС и сетью

Я столкнулся со следующей проблемой. Существует один сервер (DL160 G5), на котором работает Centos 6.3 с ядром по умолчанию 2.6.32-220.2.1.el6.x86_64 - на этом этапе я хотел бы добавить, что проблема появилась также в более старой версии - 6.1 и более раннем ядре (не запомните, какая именно версия). Установлена ​​cPanel, и время от времени она становится недоступной (подключение к сети). Я проверил (через KVMoIP):

Обычно нормально работает через 1-15 минут. Что я могу еще проверить? Это определенно проблема ОС - при возникновении проблемы трафик на интерфейсе идет только в одном направлении, не может даже проверить петлю. Любые идеи? Рекомендуемые проверки? Ничего я выше не проверял.

Это маловероятно, но недавно у меня была проблема, при которой через случайные промежутки времени в некоторых системах наблюдалось очень большое время ЦП «СИСТЕМА», что было достаточно плохо, чтобы инструменты кластеризации считали систему мертвой и вызвали остановки и тому подобное.

Во время вашей проблемы попробуйте top и ударил 1 , чтобы расширить процессоры и посмотреть, не показывают ли один или несколько процессоров странное поведение.

Вот как это могло бы выглядеть, если бы эта проблема возникла. Обратите внимание на высокое значение «sy».

Cpu0  : 16.7%us, 25.0%sy,  0.0%ni, 50.0%id,  0.0%wa,  0.0%hi,  8.3%si,  0.0%st
Cpu1  : 28.6%us, 42.9%sy,  0.0%ni, 28.6%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu2  :  6.0%us, 11.3%sy,  0.0%ni, 80.5%id,  0.0%wa,  0.0%hi,  2.3%si,  0.0%st
Cpu3  : 20.0%us, 60.0%sy,  0.0%ni, 20.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st

Вы также можете запустить dstat -talm (возможно, в фоновом режиме и перенаправлении в файл), чтобы получить посекундную статистику, которая может помочь в диагностике проблемы, если вы не можете увидеть ее сразу после запуска.

Обратите внимание, что для решения моей проблемы я неделями работал с поддержкой Red Hat и, в конце концов, просто попытался установить более новую версию ядра с исправлениями, что и было решением.

CentOS или любой вариант Linux делают это не просто для развлечения. Есть основная проблема с оборудованием.

Я предполагаю, что ваш сервер - это VMware или другой виртуализированный гость, и проблема возникает во время создания гостевого снимка.

Ваш маркированный список был довольно длинным, но в нем не упоминались журналы. Что-нибудь интересное в dmesg выход или под /var/log?