Назад | Перейти на главную страницу

Самые мощные инструменты веб-аналитики с открытым исходным кодом?

Нужны советы по выбору инструментов веб-аналитики с открытым исходным кодом, включая как тегирование страниц, так и тип анализа файла журнала. Я знаю некоторые из них: piwik, открытая веб-аналитика, awstats и многое другое ... какие из них самые лучшие (тип тегов страницы и тип анализа файла журнала)?

В области анализатора лог-файлов наиболее широко используются:

  • AWStats
  • Webalizer
  • Аналоговый
  • W3Perl

Аналог и Webalizer написаны на C и работают быстрее (10000-20000 строк в секунду).

Как упоминалось ранее @MadHatter, Analog был разработан бывшим статистиком из Кембриджа, что делает его действительно точным и техническим инструментом, но с 2005 года он больше не разрабатывается.

Webalizer больше не разрабатывается, но его проще использовать, чем Analog.

AWStat и W3Perl написаны на Perl, и это наиболее активные проекты, но они намного медленнее, чем Analog и Webalizer (3000/4500 строк в секунду). Они отличаются друг от друга производимыми данными и способом их представления.

AWStat отображает статистику очень привлекательно, но дает меньше статистики, чем W3Perl.

Я советую вам эти ссылки для получения дополнительной информации:

http://www.aardal.com/stats/docs/uk/speed.html
http://www.w3perl.com/
http://awstats.sourceforge.net/

Мой совет:

  • W3Perl, если вам нужна детальная статистика и у вас не слишком много ГБ файлов журнала
  • AWStat в случае, если вам не нужно иметь слишком много ГБ файлов, и вам нужно хорошее графическое представление.
  • Webalizer, если вам нужно проанализировать массу файлов журналов.
  • Аналог, если вам нужна действительно точная статистика, огромные файлы журналов и у вас есть опыт разработки на C (или вы знаете кого-нибудь, кто может помочь).

Что касается тегов страниц, победителем, безусловно, является Google Analytics, собираемые и производимые данные лучше, чем другие решения, но, как однажды может случиться, Google попросит за это денег ...

W3Counter и Xiti - это провайдеры, которые требуют от вас для бесплатной версии установить изображение на каждую веб-страницу, которую вы хотите отслеживать. Оба предназначены для небольших сайтов.

Open Web Analytics и Pikwik - отличные решения с открытым исходным кодом. Оба они достаточно зрелые и стабильные, но для них требуется база данных MySQL и поддержка PHP.

Если вам не нужно «домашнее» решение, я бы определенно выбрал Google Analytics, а между проектами с открытым исходным кодом я бы выбрал Open Web Analytics, поскольку он более зрелый, чем Piwik.

Я очень доволен пивиком. Просто упускаю возможность настраивать виджеты в зависимости от сайта. Я использую его для проверки своих сайтов на drupal, также есть модуль для drupal.

За мои деньги лучший инструмент для анализа журналов - это аналог. Он ошеломляюще быстрый (поиск по модулю DNS, который одинаково медленен для всех), написан бывшим статистиком из Кембриджа и имеет очень полезная страница говорит вам - и вашему руководству - что жестяная банка и не может быть должным образом известным из ваших веб-журналов, несмотря на странные коммерческие заявления.

Однако я не могу комментировать теги страниц; Прости.

Это экспериментальная программа, но тем не менее впечатляющая:

Hummingbird позволяет вам видеть, как посетители взаимодействуют с вашим сайтом в режиме реального времени. Под «реальным временем» мы не подразумеваем, что он обновляется каждые 5 минут - WebSockets позволяет Hummingbird обновлять 20 раз в секунду. Hummingbird построен на базе Node.js, нового набора веб-инструментов javascript, который может обрабатывать большие объемы трафика и множество одновременных пользователей.

Я бы сказал (хотя я как соучредитель предвзято ;-), что Снегоочиститель - это самый мощный инструмент веб-аналитики на основе тегов с открытым исходным кодом.

SnowPlow имеет слабо связанную распределенную архитектуру, в которой используются Hadoop и Hive, поэтому она масштабируется до миллионов или даже миллиардов событий - это то, что не может сделать ни одно решение на основе СУБД MySQL или другого СУБД.

Другим большим нововведением SnowPlow является то, что данные о ваших событиях хранятся в чистой, неизменяемой, денормализованной атомарной структуре «плоских файлов» - другими словами, в хранилище данных аналитики. Это позволяет выполнять множество очень сложных анализов с помощью Hive, а также напрямую объединяться с вашими сторонними данными (например, CRM или данными о продажах). Опять же, это более мощное решение, чем другие решения, которые, как правило, сворачивают атомарные данные в агрегаты, усекают старые данные или используют утомительные нормализованные структуры, которые действительно сложно запросить напрямую или присоединиться к другим источникам.

Вы можете узнать больше о Техническая архитектура SnowPlow здесь.

Бумеранг - лучший инструмент для анализа производительности на стороне клиента, но это всего лишь js-агент - я не знаю ни одного готового инструмента для создания отчетов, Пастмон полезен для работы в сети, Piwik и AwStats, о которых вы уже упоминали. Аналоговый инструмент очень похож на AwStats - менее настраиваемый, но гораздо более быстрая обработка.

Если вы хотите внедрить собственное решение, есть бесплатные IP к доступным данным о местоположении

Я знаю людей, которые используют Webalizer для анализа журнала веб-сайта. Упомяну еще об одном варианте.

Есть также этот обсуждение возможностей.

После некоторого исследования пакетов веб-аналитики с открытым исходным кодом я думаю, что явные победители http://www.openwebanalytics.com и http://piwik.org/

Причина в простоте использования, возможности установки в реальном времени.

Одна впечатляющая особенность, которую я хотел бы упомянуть, - это тепловая карта, созданная openwebanalytics.