Я просто хочу контролировать небольшую горстку серверов (менее 10).
Из разных источников кажется, что главными претендентами (по крайней мере, для открытого исходного кода) являются:
Из того, что я прочитал, многие люди склонны использовать munin и nagios вместе - munin для истории и графиков, а nagios для предупреждений.
С другой стороны, похоже, что Zabbix - более полное решение и его легче настроить, чем любой из двух других. Так что я подумывал пойти по этому пути.
Мои мысли прямо сейчас:
Я думаю, что было бы лучше сосредоточиться на ответах на конкретные вопросы, которые у вас возникли, с учетом размера вашего запланированного развертывания (~ 10 контролируемых хостов).
Каковы общие недостатки Zabbix?
У Zabbix мало места на ящиках, которые он отслеживает?
Определенно да. Zabbix может отслеживать, используя такие методы, как SNMP, простые проверки сети (открыт ли порт?), А также имеет собственный агент для многих платформ. Поскольку агент написан на C, он занимает очень мало места (в отличие от множества интерпретируемых скриптов ...). Вы можете легко комбинировать различные проверки на одном контролируемом хосте. Обратите внимание, что вы не ограничены серверами мониторинга, вы также можете добавлять сетевые устройства и другие вещи.
Мне действительно нужно настроить для этого целый другой сервер? В настоящее время у меня есть сервер с очень небольшой нагрузкой - могу ли я использовать его для двух целей?
Зависит - если он работает под управлением одной из поддерживаемых операционных систем для сервера - определенно. Для этой среды требования будут действительно низкими. Обязательно используйте шаблоны по умолчанию только в качестве ориентира, рекомендуется создавать свои собственные с более длинными интервалами между проверками. По сути, Zabbix состоит из 3-х компонентов - БД, внешнего интерфейса, сервера. При желании вы можете повторно использовать существующий сервер базы данных и существующий веб-сервер в компании для первых двух компонентов, а затем запустить сервер Zabbix на любой поддерживаемой платформе - это совершенно допустимая конфигурация.
Любые конкретные запросы будут приветствоваться в #zabbix на Freenode.
Я использую Zabbix уже 2 года, до того, как использовал Nagios ...
На мой взгляд, большая разница в том, что с Nagios вы получаете статус (ОК / ПРЕДУПРЕЖДЕНИЕ / КРИТИЧЕСКИЙ), с Zabbix вы получаете данные (целое число, число с плавающей запятой, строка ...)
Это действительно хороший аргумент для Zabbix, потому что:
Также очень приятно использование агента для простого / быстрого сбора основных системных данных.
Недостатки Zabbix:
Каковы ваши цели мониторинга? Время безотказной работы? Производительность? Показатели биллинга? Некоторые из перечисленных выше утилит лучше подходят для каждого из этих применений, а некоторые - хуже.
Для время безотказной работы гарантия, мы используем контролировать, который является бесплатным и простым в установке в системах Unix / Linux. Эта утилита отслеживает, жив ли процесс, и гарантирует, что он не использует больше, чем справедливая доля ресурсов (ЦП, память) - и если он ведет себя неправильно, monit перезапустит процесс.
Для мониторинг производительности, Я предлагаю Мунин. Его легко настроить, и в качестве метода сбора данных используется perl / bash / python / something. Munin может собирать данные о производительности нескольких машин в одном месте и строить простые для понимания графики.
Для показатели биллинга (потребление полосы пропускания), я предлагаю PRTG. Это не бесплатно, но предоставляет отчеты и статистику профессионального уровня, которые можно легко использовать как часть платежного отчета вашего клиента, если вы сделаете что-то подобное. Мы заменили нашу установку Zabbix, которая требовала использования агентов на каждой отслеживаемой машине, на PRTG, который использует SNMP, и мы никогда не оглядывались назад.
Я также использовал Зенос, который был очень красивым и простым в установке и настройке. Зеноссу потребовался длительный период обучения, чтобы научиться получать все необходимые нам показатели.
Я использую zabbix для мониторинга инфраструктуры нашей компании (это всего 6 серверов + все сетевое оборудование). У меня zabbix более двух лет, и он отлично работает. Мне нравится то, что все это в одном приложении и не требует установки множества плагинов. Интерфейс не получил никаких наград за дизайн, но с точки зрения функциональности продуман на удивление хорошо. В прошлом у меня были некоторые периодические проблемы с оборудованием на наших серверах, и наличие большого количества исторических данных в zabbix определенно очень помогло в их решении.
Некоторые версии, казалось, имели проблемы со стабильностью и время от времени падали, но monit позаботился об этом.
Я рекомендую поместить zabbix в отдельный ящик (и некоторое списанное серверное оборудование 3-4 года назад будет работать довольно хорошо) Само приложение не очень тяжелое, но оно создает значительную нагрузку на базу данных (mysql в моем случае) - сохранение всех исторических данных обходится недешево.
Я использовал и Zenoss, и Zabbix. Единственная жалоба на Zabbix заключается в том, что он всегда дает сбой. У меня была одна установка на моей старой работе, где мы удвоили Zabbix и Zenoss (Камил может ответить больше по этому поводу), а также установка дома и в Free Geek Vancouver, где я работаю сисадмином. Все три вылетают регулярно, и демон необходимо перезапускать.
Zenoss, на мой взгляд, хорош, потому что он довольно стабилен и имеет гораздо более приятный интерфейс, но при этом очень ресурсоемкий.
Несмотря на все вышесказанное, я бы по-прежнему выбрал Zabbix для решения для мониторинга только потому, что то, как SOP для настройки новых устройств больше соответствует моему мнению. Лучше всего настроить их все и посмотреть, какой из них вам больше нравится.
Мы используем Zabbix уже более 4 лет (сейчас работает 1.6), и он до сих пор ни разу не дал сбоев (работает на RHEL5). Моя единственная жалоба в прошлом заключалась в отсутствии документации и дружеской поддержки (речь идет о бесплатной поддержке сообщества). Теперь я заметил лучшую документацию.