Я только начал получать предупреждение Nagios от нашего сервера сборки о том, что количество процессов превысило лимит. Глядя на наши графики Мунина, я вижу, что количество процессов неуклонно увеличивалось с 280 в декабре до текущего значения 430.
Мне интересно, как я могу определить причины увеличения количества процессов, чтобы я мог перезапустить службы или настроить их конфигурацию по мере необходимости.
Сведения о сервере: CentOS 5.1, в основном работает наш сервер сборки Hudson, который работает под Tomcat, и сервер Apache httpd, который в основном является просто прокси для Hudson. Я попытался перезапустить httpd и Tomcat, но количество процессов осталось прежним. «верх» говорит, что активен только один из процессов; остальные спят.
Попробуйте это регулярно, чтобы увидеть, как счетчики процессов увеличиваются и уменьшаются для "определенного" именованного процесса. Он игнорирует PID и просто смотрит на конец строки вне времени процессора.
ps -ef | perl -a -F'\d+:\d+:\d+ ' -n -e 'print @F[1]' -- | sort | uniq -c | sort -n
Это работает в поле RHEL. Вы можете поместить его в cron после того, как получите представление о том, как выглядит список начальных процессов.