Назад | Перейти на главную страницу

Кластер Mongrel тихо останавливается на экземпляре EC2, на котором запущен Debian 5.0.1

Проблема возникает не очень часто, но, тем не менее, она существует, и я не уверен, с чего начать. Я нашел PID ублюдка в / var / log /, и единственные сообщения, которые их содержали, следующие:

Jun  7 07:46:24 staging kernel: 4gb seg fixup, process mongrel_rails (pid 29498), cs:ip 73:00937a5c

Это как-то связано с конкретной версией Xen libc, но это не критично, и процессы все еще работают, и эти сообщения накапливаются в kern.log

На самом деле я ищу не только конкретное решение (которое, вероятно, не может быть предоставлено из приведенного выше описания), но и любые советы о том, как настроить мониторинг или расследовать такие случаи.

У меня были эти сообщения, когда libc6-xen не был установлен в xen domU. Итак, убедитесь, что у вас установлен этот пакет ...

apt-get install libc6-xen

Когда используется другой вариант libc, он все равно будет работать, но будет работать медленнее, так как ядру придется улавливать неправильную операцию и вместо этого делать правильные действия. Цитируемое сообщение генерируется ядром именно в этой ситуации.

Итак, вы правильно угадали, это не объясняет, почему дворняга останавливается. Проверьте документацию mongrel, чтобы включить журналы отладки, если они есть. В противном случае вы всегда можете попытаться ограничить процесс до тех пор, пока он не потерпит неудачу ... конец журнала даст вам подсказки о том, как он терпит неудачу, и, возможно, вы поймете, почему.

Мы используем нагиос для наблюдения за нашими дворнягами (наряду с сотнями других сервисов).

Он просто проверяет, что на каждом из требуемых портов работают беспородные процессы. Если нет, он их перезапускает.

Не совсем ответ, но надо ли использовать дворнягу? Я перешел на apache + пассажир и больше не оглядывался.

Вы можете посмотреть на Бог для наблюдения за вашими дворнягами и управления ими. Он довольно гибкий, и вы можете использовать его для перезапуска на основе определенных пороговых значений, таких как объем памяти, использование ЦП, колебание и многое другое. Вы также можете рассмотреть контролировать, который я знаю о людях, заменяющих бога.