Как раз сегодня я установил экземпляр Google Cloud Compute для запуска своего веб-сервера, который я перенес от другого поставщика VPS, с которым у меня был довольно неудачный опыт.
Время от времени (возможно, 3 или 4 раза с сегодняшнего утра) сервер Google становится недоступным извне. Обычно я могу пинговать его, подключаться к нему по ssh с адреса Cox Cable и получать с него веб-страницы по http. Когда возникает проблема, я не могу выполнить ни одно из этих трех действий: ping получает 100% потерю пакетов, ssh зависает (и существующие ssh-соединения разрываются) и http в веб-браузере также зависает.
Чтобы сделать проблему более странной, во время проблемы, если я подключу ssh к VPS из веб-интерфейса Google, я могу войти в систему и пинговать сервер имен Google на 8.8.8.8, а также я могу пинговать на www.yahoo.com. Таким образом, проблемы возникают только с входящим трафиком, а не с исходящим.
Это немного похоже на конфликт IP-адресов, но только для внешнего IP-адреса, а не для внутреннего IP-адреса. Но мне трудно убедить себя, что это может быть проблемой.
Я изменил брандмауэр только одним способом: добавил одно правило брандмауэра, разрешающее в http.
Внешний IP-адрес: 34.94.223.166.
Может кто-нибудь дайте мне знать, как я могу сделать вещи более надежными?
Во время последнего события система не работала около часа.
Если посмотреть на / var / log / syslog * во время последнего события, ничего интересного нет - хотя сообщения не останавливают эфир.
Может быть любое количество проблем с производительностью или доступностью. Определите, когда это произойдет, отключены ли службы для всех или только для определенных маршрутов в Интернете.
Чтобы увидеть проблемы, требуется мониторинг вашего экземпляра. Прочтите свои файлы журналов.
Поскольку вы используете GCP, подумайте об использовании Stackdriver. Stackdriver агент фиксирует метрики экземпляра, может отслеживать Apache httpd или nginx и может принимать syslog.
Обнаружение сбоев, попробуйте получить к нему доступ от как можно большего числа интернет-провайдеров, например, из экземпляров в других облаках. Вручную или с помощью службы мониторинга. Просто никто не делает различий между одним провайдером, у которого проблема, или вашими услугами.
Высокая доступность за пределами одного экземпляра достигается с помощью балансировщиков нагрузки. Однако вы можете сначала улучшить процессы мониторинга с помощью одного экземпляра.