Я использую виртуальный частный сервер (Debian / Linux с apache + tomcat + jruby), и время от времени он становится недоступным (я даже не могу его пропинговать). Я виню в этом нашего поставщика услуг. Когда это происходит, сервер необходимо перезагрузить через консоль управления провайдера, и все вернется в нормальное состояние. Я пробовал просматривать журналы в var / log, но не нашел там ничего необычного. Каковы дальнейшие шаги в расследовании подобных инцидентов?
Это первые вопросы, на которые я хотел бы ответить, чтобы устранить проблему:
У вас есть KVM, с помощью которого вы могли бы попытаться установить сеанс удаленной консоли? В любом случае вам захочется узнать, что происходит, из внутри сервер в момент сбоя.
Когда журналы не указывают на ошибки и у вас нет возможности установить удаленную консоль, вы можете согласиться на cron
запись, которая регулярно отображает вывод настроек вашей сети / брандмауэра в файл, который вы можете проверить позже.
Было бы полезно, если бы вы упомянули в журналах, что искали, и не смогли найти.
Наверное, здесь мало что можно сделать. Но вы можете попробовать настроить базовый внутренний сторожевой таймер - с помощью cron (или, предпочтительно, демона) для запуска и регистрации событий через регулярные короткие промежутки времени - а затем проверить, работает ли он постоянно до перезагрузки.
И увеличить логирование.
Предположительно вы платите поставщику услуг - вам следует попросить его предоставить подробности своего расследования.