Вчера около часу ночи наш сервер перестал работать. Это случается не часто, но я пытаюсь разобраться в этом.
Нет необычного объема трафика, нет необычных процессов, просто внезапно сервер начал убивать процессы fcgid.
[Thu Aug 02 01:17:32 2012] [warn] mod_fcgid: process 26460 graceful kill fail, sending SIGKILL
... для такого количества процессов fcgid, сколько у нас ...
Время простоя процессора упало до 0%, а операции ввода-вывода, похоже, занимали большую часть нагрузки. Выпуск длился около 5 минут.
Я подозреваю, что была какая-то активность подкачки, хотя я не уверен, было ли это из-за того, что убитые процессы были заменены, чтобы умереть, или это было потому, что какой-то процесс увеличил использование памяти быстрее, чем мои сценарии наблюдения за процессами могут их увидеть.
Oom-killer не был запущен (по крайней мере, он не зарегистрирован), поэтому я думаю, что это был Apache, по какой-то причине перезапускавший процессы. Это не регулярно, и в cron ничего очевидного не появляется.
Может ли это вызвать нормальный процесс Apache? У нас работают десятки разных сайтов, и было поздно, поэтому объем был очень и очень низким. (возможно, 200 запросов за 10 минут).
Измените этот файл /etc/httpd/conf.d/fcgid.conf и измените FcgidIOTimeout на
FcgidIOTimeout 90
Меня устраивает.
Tkx JD
У меня была проблема, ошибка в основном связана с превышением времени ожидания mod_fastcgi, поместите здесь решение, которое для меня имеет решение:
Измените этот файл /etc/httpd/conf.d/fcgid.conf и изменить, FcgidIOTimeout к
FcgidIOTimeout 500
И перезапустите apache:
/ usr / sbin / apachectl перезапуск
Администраторы серверов, использующие Ubuntu Server и Webmin / Virtualmin, могут решить эту проблему, отредактировав файл fcgid.conf
файл. Приведенные ниже инструкции предназначены для Ubuntu Server, и если вы используете другой Linux, расположение конфигурации может отличаться.
cd /etc/apache2/mods-enabled
и нажмите ввод.sudo pico fcgid.conf
и нажмите ввод.FcgidConnectTimeout 20
и измените его на чтение FcgidConnectTimeout 120
.CTRL+X
или CMD+X
, затем нажмите Y
сохранить.sudo service apache2 restart
и нажмите ввод.Если проблема не исчезнет, вы можете увеличить 120 до большего числа.
СОВЕТ: Используйте Pingdom (это бесплатно) чтобы уведомить вас, когда веб-сайт недоступен.
У меня была такая же проблема пару ночей назад. Я нашел сообщение в блоге, где кто-то удалил Webmin и Usermin и обнаружил, что они перестали получать ошибку.
Я обновил Webmin и, похоже, решил мою проблему. Я все еще получаю пару ошибок здесь и там, но это не забивает ЦП, как это было раньше.