Назад | Перейти на главную страницу

Сервер CentOS останавливается, а затем снова включается

Сервер CentOS 5.2 LAMP

Сервер замедляется до точки, когда никакие службы не отвечают. Через несколько минут он возвращается и работает нормально. Сервер продолжает этот цикл, что может быть не так?

Я остановил exim и proftpd услуги на данный момент. Я использовал top команда, чтобы увидеть использование ЦП, но все было 0, даже когда сервер перестал отвечать. У меня также была запущена служба Java Tomcat, которую я тоже остановил, но проблема все еще сохраняется.

Журналы не показывают никаких признаков dos / ddos.

Любые идеи?

Вероятно, лучший инструмент для проверки в этом случае - sar. Он должен показывать вам статистику до зависания сервера включительно. Если он у вас не установлен, это часть sysstat пакет.

Как часто он это делает? Раз в день или каждые несколько часов? Похоже, это может быть память или дисковый ввод-вывод, но я не уверен.

Краткий список того, что нужно проверить:

  • Проверьте загрузку ЦП, загрузку и использование памяти. Это должно дать вам хорошее представление о том, в чем проблема. Если нагрузка очень высока, ваш сервер просто не может обработать слишком много трафика. Если у вас высокий процент ожидания ввода-вывода, у вас слишком большая активность диска. Если у вас вообще нет нагрузки / использования ЦП, скорее всего, это будет своего рода блокировка приложения.
  • Сверху проверьте приложения, использующие много памяти / ЦП (M = сортировка по памяти, P = сортировка по загрузке ЦП) или, по крайней мере, больше, чем должны. Проверьте наличие заблокированных приложений, ища букву «D» в столбце «S».
  • Проверьте top / free / vmstat на предмет использования подкачки. Он должен быть 0 или очень низким. Если вы используете подкачку, вам придется перенастроить стек LAMP, чтобы использовать меньше памяти.
  • Проверьте netstat на наличие признаков DoS (например).
  • Проверьте системные (/ var / log / messages) и журналы приложений (Apache, MySQL и т. Д.) На наличие соответствующих сообщений об ошибках. Если это повторяется каждые несколько минут, вы можете увидеть набор сообщений об ошибках.
  • Проверьте дисковое пространство через df -h и статус диска с smartctl.
  • Если все это не вызывает никаких проблем, это может быть проблема с приложением или тупиковая блокировка. Попробуйте включить / добавить в приложение ведение журнала отладки и посмотрите, не сузите ли вы, где возникает проблема.