У меня проблема с моим Debian 2.6.38-3
сервер, который ** вылетает * раз в 3 месяца, но я не могу понять почему.
Согласно Pingdom, сайт умер около 4 часов утра, но ни один из журналов, которые я просмотрел, не содержит информации о каких-либо ошибках.
Это файлы журнала, которые я просмотрел:
Судя по приведенным журналам, это неправильно. Вот пример из /var/log/messages
.
21 января 04:01:46 debian god [1195]: приложение все еще живо через 10 секунд; отправил SIGKILL
21 января, 11:18:20 ядро debian: imklog 3.18.6, источник журнала = / proc / kmsg запущен.
Есть идеи, какие журналы могут содержать информацию, которую я ищу?
** вылетает как в ни на что не отвечает. Экран становится черным, не отвечает на веб-запросы, и я не могу получить к нему доступ по SSH. *
К сожалению, вероятно, ни один из них. Когда возникает паника ядра, не остается ни подсистемы журналирования, в которую можно было бы писать журналы, ни файловых дескрипторов для их обработки.
Единственно возможным вариантом было бы перенаправить консоль на / dev / ttyS0 и настроить другой сервер для протоколирования вывода оттуда.
Таким образом, когда ядро паникует (если это то, что происходит), вы сможете отслеживать журнал с сервера мониторинга через последовательный порт.
SIGKILL кто-то насильно убивает процесс. Я думаю, вам нужен тщательный мониторинг. Вам необходимо постоянно контролировать память, обработку, SWAP, среднюю нагрузку, количество процессов, зомби все запущенные службы. Так можно найти подозреваемого. Предлагаю вам установить nagios и следить за всем вышеперечисленным.
Надеюсь, вы проверили crontab, ошибки ядра и т. Д.
Спасибо