Назад | Перейти на главную страницу

Разбираемся, почему сервер не отвечает

Я использую виртуальный частный сервер (Debian / Linux с apache + tomcat + jruby), и время от времени он становится недоступным (я даже не могу его пропинговать). Я виню в этом нашего поставщика услуг. Когда это происходит, сервер необходимо перезагрузить через консоль управления провайдера, и все вернется в нормальное состояние. Я пробовал просматривать журналы в var / log, но не нашел там ничего необычного. Каковы дальнейшие шаги в расследовании подобных инцидентов?

Это первые вопросы, на которые я хотел бы ответить, чтобы устранить проблему:

  • В то время, когда сервер перестал отвечать, имел ли он возможность отправлять исходящие ping-пакеты?
  • Как конфигурация сети выглядит во время сбоя?
  • Есть ли на сервере брандмауэр? Каково его состояние на момент отказа?

У вас есть KVM, с помощью которого вы могли бы попытаться установить сеанс удаленной консоли? В любом случае вам захочется узнать, что происходит, из внутри сервер в момент сбоя.

Когда журналы не указывают на ошибки и у вас нет возможности установить удаленную консоль, вы можете согласиться на cron запись, которая регулярно отображает вывод настроек вашей сети / брандмауэра в файл, который вы можете проверить позже.

Было бы полезно, если бы вы упомянули в журналах, что искали, и не смогли найти.

Наверное, здесь мало что можно сделать. Но вы можете попробовать настроить базовый внутренний сторожевой таймер - с помощью cron (или, предпочтительно, демона) для запуска и регистрации событий через регулярные короткие промежутки времени - а затем проверить, работает ли он постоянно до перезагрузки.

И увеличить логирование.

Предположительно вы платите поставщику услуг - вам следует попросить его предоставить подробности своего расследования.