Резюме
Я запустил веб-сайт на VPS и впервые столкнулся с простоями (~ 4 минуты). Однако веб-сайт был недоступен только для меня, и я ничего не вижу в очевидных файлах журнала. Где мне искать?
В php5-fpm.log нет записей ни по времени, ни по 20 минут с каждой стороны. В журнале ошибок ничего нет.
Единственные записи в журнале доступа nginx - это «Это не работает для всех или только для меня».
Где еще мне посмотреть?
Подробно
Сервер: Ubuntu 12.04, стек LEMP
Я получал сообщение об ошибке: «Эта веб-страница недоступна». Однако, согласно другим проверкам пинга, веб-сайт был недоступен только для меня (мой дом, несколько компьютеров в моем доме не работали). Другие веб-сайты работали нормально.
Он был отключен всего на пару минут, и у меня не было времени, чтобы кто-то еще попробовал его. Я проконсультировался со своим поставщиком доменов, и они сказали, что у них нет простоев.
Журнал доступа Nginx:
(Advagg - это модуль drupal, который объединяет файлы css и js. В случае сбоя сайт должен отображаться без стиля).
127.0.0.1 - - [06/Mar/2014:22:24:20 +0000] "GET /authcache-varnish-get-key HTTP/1.1" 302 46 "http://www.downforeveryoneorjustme.com/mysite.net" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/33.0.1750.146 Safari/537.36"
127.0.0.1 - - [06/Mar/2014:22:24:21 +0000] "GET / HTTP/1.1" 302 46 "http://www.downforeveryoneorjustme.com/mysite.net" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/33.0.1750.146 Safari/537.36"
127.0.0.1 - - [06/Mar/2014:22:24:38 +0000] "GET /sites/default/files/advagg_css/css__1394144677.css HTTP/1.1" 404 325 "-" "Drupal (+http://drupal.org/)"
127.0.0.1 - - [06/Mar/2014:22:24:39 +0000] "GET /sites/default/files/advagg_js/js__1394144677.js HTTP/1.1" 404 325 "-" "Drupal (+http://drupal.org/)"
127.0.0.1 - - [06/Mar/2014:22:25:00 +0000] "GET /sites/default/files/advagg_css/css__1394144700.css HTTP/1.1" 404 325 "-" "Drupal (+http://drupal.org/)"
127.0.0.1 - - [06/Mar/2014:22:25:01 +0000] "GET /sites/default/files/advagg_js/js__1394144700.js HTTP/1.1" 404 325 "-" "Drupal (+http://drupal.org/)"
Вы, вероятно, не сможете узнать, что произошло, если у вас нет (или вы не можете получить) Netflow или аналогичные журналы и просмотреть их (и даже тогда это ужасно много работы)
Как правило, лучший способ справиться с подобными вещами - это иметь мониторинг и вооружиться знаниями и инструментами, чтобы проверять это в процессе. Простой инструмент, который вы должны установить практически в любой системе как сетевой администратор, - это «mtr» (или его эквивалент для Windows или Android). Это объединяет traceroute и ping и показывает, где закрадываются сетевые проблемы.
Другой инструмент (но больше работы / $$) - это настроить (или приобрести) мониторинг ваших систем, например, с помощью Nagios и Cacti из удаленной системы.
Хотя невозможно узнать, что вызвало отключение, среди наиболее вероятных причин есть
Ваше соединение DSL или эквивалентное отключено и повторно подключено, или
Произошла аномальная маршрутизация, и маршрутизатор вышел из строя, поэтому вы потеряли соединение, пока BGP переконвергировался [то есть нашел другой путь]. Это могло закрасться где угодно между вами и вашим сервером.