У меня есть сервер под управлением CentOS Linux, и очень редко (может быть, раз в 3 месяца) происходит что-то, что приводит к исключительно высокой загрузке процессора (400%), что приводит к зависанию сервера.
У меня проблема в том, что когда я перезагружаю сервер, я не могу понять, что вызвало всплеск. Я попытался настроить задание cron, чтобы время от времени выгружать в файл журнала 10 основных процессов ЦП, но при высокой загрузке ЦП задание cron, по-видимому, тоже не запускается.
Я как бы новичок в запуске сервера, поэтому надеюсь, что вы, ребята, дадите совет, как мне лучше регистрировать процессы и выяснить, что вызывает внезапный всплеск, когда он произойдет в следующий раз. Я уверен, что это просто сценарий или процесс, который выходит из-под контроля, но пока я не смогу понять, что это за сценарий, я как бы в растерянности ...
Спасибо за любую помощь, которую вы можете оказать!
Не строго говоря ответ на ваш вопрос, но проверьте контролировать. Вы можете настроить его для мониторинга всех видов вещей, включая глобальную системную статистику. Например, если загрузка процессора превышает 97% в течение 3 минут, мои серверы перезагрузятся. Если apache использует> 80% ЦП в течение 5 минут, он перезапускается и так далее. Это невероятно полезная программа, благодаря которой мне намного легче спать по ночам. :-)
Возможно, это вообще не связано с процессором. Если вы посмотрите на такие утилиты, как sar (sysstat), вы сможете получить больше информации о том, что происходило во время зависания системы (ЦП / ввод-вывод диска / память / свопинг и т. Д.).
У меня есть пара вопросов:
Видите ли вы после перезагрузки записи журнала за период, когда система была заморожена?
Как определить, что система зависла?
Вы вообще можете войти в систему?
Как часто вы запускали это задание cron для ведения журнала? Возможно, вам стоит запускать его чаще, потому что загрузка процессора не достигает пика мгновенно, вы должны где-то увидеть увеличение. В качестве альтернативы вы можете использовать наверху для отслеживания нагрузки на ресурсы (включая загрузку процессора) сверхурочно.