Назад | Перейти на главную страницу

Сервер Google Compute продолжает отключаться от сети, не знаю почему

Как раз сегодня я установил экземпляр Google Cloud Compute для запуска своего веб-сервера, который я перенес от другого поставщика VPS, с которым у меня был довольно неудачный опыт.

Время от времени (возможно, 3 или 4 раза с сегодняшнего утра) сервер Google становится недоступным извне. Обычно я могу пинговать его, подключаться к нему по ssh с адреса Cox Cable и получать с него веб-страницы по http. Когда возникает проблема, я не могу выполнить ни одно из этих трех действий: ping получает 100% потерю пакетов, ssh зависает (и существующие ssh-соединения разрываются) и http в веб-браузере также зависает.

Чтобы сделать проблему более странной, во время проблемы, если я подключу ssh к VPS из веб-интерфейса Google, я могу войти в систему и пинговать сервер имен Google на 8.8.8.8, а также я могу пинговать на www.yahoo.com. Таким образом, проблемы возникают только с входящим трафиком, а не с исходящим.

Это немного похоже на конфликт IP-адресов, но только для внешнего IP-адреса, а не для внутреннего IP-адреса. Но мне трудно убедить себя, что это может быть проблемой.

Я изменил брандмауэр только одним способом: добавил одно правило брандмауэра, разрешающее в http.

Внешний IP-адрес: 34.94.223.166.

Может кто-нибудь дайте мне знать, как я могу сделать вещи более надежными?


Во время последнего события система не работала около часа.

Если посмотреть на / var / log / syslog * во время последнего события, ничего интересного нет - хотя сообщения не останавливают эфир.

Может быть любое количество проблем с производительностью или доступностью. Определите, когда это произойдет, отключены ли службы для всех или только для определенных маршрутов в Интернете.

Чтобы увидеть проблемы, требуется мониторинг вашего экземпляра. Прочтите свои файлы журналов.

Поскольку вы используете GCP, подумайте об использовании Stackdriver. Stackdriver агент фиксирует метрики экземпляра, может отслеживать Apache httpd или nginx и может принимать syslog.

Обнаружение сбоев, попробуйте получить к нему доступ от как можно большего числа интернет-провайдеров, например, из экземпляров в других облаках. Вручную или с помощью службы мониторинга. Просто никто не делает различий между одним провайдером, у которого проблема, или вашими услугами.

Высокая доступность за пределами одного экземпляра достигается с помощью балансировщиков нагрузки. Однако вы можете сначала улучшить процессы мониторинга с помощью одного экземпляра.