Нужны советы по выбору инструментов веб-аналитики с открытым исходным кодом, включая как тегирование страниц, так и тип анализа файла журнала. Я знаю некоторые из них: piwik, открытая веб-аналитика, awstats и многое другое ... какие из них самые лучшие (тип тегов страницы и тип анализа файла журнала)?
В области анализатора лог-файлов наиболее широко используются:
Аналог и Webalizer написаны на C и работают быстрее (10000-20000 строк в секунду).
Как упоминалось ранее @MadHatter, Analog был разработан бывшим статистиком из Кембриджа, что делает его действительно точным и техническим инструментом, но с 2005 года он больше не разрабатывается.
Webalizer больше не разрабатывается, но его проще использовать, чем Analog.
AWStat и W3Perl написаны на Perl, и это наиболее активные проекты, но они намного медленнее, чем Analog и Webalizer (3000/4500 строк в секунду). Они отличаются друг от друга производимыми данными и способом их представления.
AWStat отображает статистику очень привлекательно, но дает меньше статистики, чем W3Perl.
Я советую вам эти ссылки для получения дополнительной информации:
http://www.aardal.com/stats/docs/uk/speed.html
http://www.w3perl.com/
http://awstats.sourceforge.net/
Мой совет:
Что касается тегов страниц, победителем, безусловно, является Google Analytics, собираемые и производимые данные лучше, чем другие решения, но, как однажды может случиться, Google попросит за это денег ...
W3Counter и Xiti - это провайдеры, которые требуют от вас для бесплатной версии установить изображение на каждую веб-страницу, которую вы хотите отслеживать. Оба предназначены для небольших сайтов.
Open Web Analytics и Pikwik - отличные решения с открытым исходным кодом. Оба они достаточно зрелые и стабильные, но для них требуется база данных MySQL и поддержка PHP.
Если вам не нужно «домашнее» решение, я бы определенно выбрал Google Analytics, а между проектами с открытым исходным кодом я бы выбрал Open Web Analytics, поскольку он более зрелый, чем Piwik.
Я очень доволен пивиком. Просто упускаю возможность настраивать виджеты в зависимости от сайта. Я использую его для проверки своих сайтов на drupal, также есть модуль для drupal.
За мои деньги лучший инструмент для анализа журналов - это аналог. Он ошеломляюще быстрый (поиск по модулю DNS, который одинаково медленен для всех), написан бывшим статистиком из Кембриджа и имеет очень полезная страница говорит вам - и вашему руководству - что жестяная банка и не может быть должным образом известным из ваших веб-журналов, несмотря на странные коммерческие заявления.
Однако я не могу комментировать теги страниц; Прости.
Это экспериментальная программа, но тем не менее впечатляющая:
Hummingbird позволяет вам видеть, как посетители взаимодействуют с вашим сайтом в режиме реального времени. Под «реальным временем» мы не подразумеваем, что он обновляется каждые 5 минут - WebSockets позволяет Hummingbird обновлять 20 раз в секунду. Hummingbird построен на базе Node.js, нового набора веб-инструментов javascript, который может обрабатывать большие объемы трафика и множество одновременных пользователей.
Я бы сказал (хотя я как соучредитель предвзято ;-), что Снегоочиститель - это самый мощный инструмент веб-аналитики на основе тегов с открытым исходным кодом.
SnowPlow имеет слабо связанную распределенную архитектуру, в которой используются Hadoop и Hive, поэтому она масштабируется до миллионов или даже миллиардов событий - это то, что не может сделать ни одно решение на основе СУБД MySQL или другого СУБД.
Другим большим нововведением SnowPlow является то, что данные о ваших событиях хранятся в чистой, неизменяемой, денормализованной атомарной структуре «плоских файлов» - другими словами, в хранилище данных аналитики. Это позволяет выполнять множество очень сложных анализов с помощью Hive, а также напрямую объединяться с вашими сторонними данными (например, CRM или данными о продажах). Опять же, это более мощное решение, чем другие решения, которые, как правило, сворачивают атомарные данные в агрегаты, усекают старые данные или используют утомительные нормализованные структуры, которые действительно сложно запросить напрямую или присоединиться к другим источникам.
Вы можете узнать больше о Техническая архитектура SnowPlow здесь.
Бумеранг - лучший инструмент для анализа производительности на стороне клиента, но это всего лишь js-агент - я не знаю ни одного готового инструмента для создания отчетов, Пастмон полезен для работы в сети, Piwik и AwStats, о которых вы уже упоминали. Аналоговый инструмент очень похож на AwStats - менее настраиваемый, но гораздо более быстрая обработка.
Если вы хотите внедрить собственное решение, есть бесплатные IP к доступным данным о местоположении
Я знаю людей, которые используют Webalizer для анализа журнала веб-сайта. Упомяну еще об одном варианте.
Есть также этот обсуждение возможностей.
После некоторого исследования пакетов веб-аналитики с открытым исходным кодом я думаю, что явные победители http://www.openwebanalytics.com и http://piwik.org/
Причина в простоте использования, возможности установки в реальном времени.
Одна впечатляющая особенность, которую я хотел бы упомянуть, - это тепловая карта, созданная openwebanalytics.