Это вопрос высокого уровня относительно использования доступ как инструмент аналитики сайта. Я настроил его на сервере nginx и отлично разбираю журналы, но кажется, что многие запросы к моему собственному сайту не имеют Referer в заголовке HTTP. Есть ли простой способ получить эту информацию? Очевидно, я знаю, что есть другие сайты со ссылками на мои собственные (такие как проект Github или история HackerNews), но они никогда не отображаются в справочной информации goaccess.
Я также понимаю, что вполне возможно, что я совершенно не понимаю и / или иным образом пытаюсь расширить границы того, что в основном является простым просмотрщиком журнала доступа. Тем не менее, как другое программное обеспечение для аналитики получает информацию о реферере? Google Analytics, Piwik и Mint, похоже, делают это довольно надежно.
РЕДАКТИРОВАТЬ - вот несколько строк из моего файла журнала. Это случай, когда я знаю, что зашел на сайт по ссылке Github.com, которая, как я ожидал, будет отображаться как референт. Непосредственно следующая строка - это место, где осуществляется доступ к таблице стилей, и она правильно идентифицирует референт как сайт, который к ней обратился.
69.139.121.104 - - [07/May/2013:18:57:46 -0400] "GET /2013/04/13/introducing-ratchet.html HTTP/1.1" 200 2195 "-" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_3) AppleWebKit/536.29.13 (KHTML, like Gecko) Version/6.0.4 Safari/536.29.13"
69.139.121.104 - - [07/May/2013:18:57:46 -0400] "GET /css/styles.css HTTP/1.1" 200 1161 "http://micahmcfarland.com/2013/04/13/introducing-ratchet.html" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_3) AppleWebKit/536.29.13 (KHTML, like Gecko) Version/6.0.4 Safari/536.29.13"
РЕДАКТИРОВАТЬ2- Я не вижу рефереров, потому что между https и http не передается информация о реферере. Не уверен, как я этого не знал, но большое спасибо за чтение и неважно!
Я использую GoAccess, и он довольно хорошо сообщает о поле реферера. Я бы сказал:
goaccess
не буду сообщать об этом~/.goaccessrc
.Имейте в виду, что ссылка отправляется клиентским браузером и поэтому ненадежна. Возможно, его там не было или оно было подделано.
Кроме того, можете ли вы опубликовать пару строк из журнала nginx, которые не сообщаются и содержат referer?
Google Analytics не использует файл журнала.