Назад | Перейти на главную страницу

Какой инструмент вы используете для мониторинга своих серверов?

Для более полного списка инструментов мониторинга и их функций ознакомьтесь с эта страница в Википедии.

В соответствии с вопросом, какие инструменты наиболее часто используются для этой задачи и каковы их сильные и слабые стороны?

Я использовал Nagios в прошлом с успехом. Он очень расширяемый (более 200 надстроек), относительно простой в использовании и множество отчетов. Отрицательным будет первоначальная установка.

Кактусы это очень хороший веб-интерфейс для RRDTool, предоставляя очень удобные графики и статистику. RRDTool это часть, которая собирает данные из нескольких систем и контролирует широкий спектр технических данных.

Мы используем решение cacti / RRDTool для мониторинга систем Unix и Windows. Мы получаем множество полезных показателей, включая нагрузку, использование ЦП / ОЗУ, пространство HD, пользователей, вошедших в систему, сетевой трафик, запущенные процессы и т. Д.

Более подробную информацию о кактусах вы найдете на Что такое кактусы? страница.

Лично я люблю Мунин который очень легко установить и написать плагины, поскольку он имеет очень простую архитектуру. Существует довольно много плагинов для всех целей, которые вы можете себе представить, так что вам, вероятно, даже не придется писать плагины в первую очередь.

Он также предоставляет красивые графики и возможность настройки (очень простых) предупреждений.

Zabbix. Он имеет открытый исходный код и достаточно прост в установке и настройке. У нас есть много настраиваемых сценариев мониторинга, которые передаются на сервер zabbix, но он заботится о централизации этих данных, их правильном отображении, уведомлениях (электронная почта, IM, SMS, твиттер и т. Д.) И т. Д.

Я делал выкатывание Spiceworks в нашей компании, и мы считаем, что это отличный инструмент не только для мониторинга серверов, но и всего остального в сети.

Он выполняет такие функции, как автоматическая инвентаризация и настраиваемый мониторинг, чтобы отправлять вам электронные письма при возникновении проблемы (например, в принтере до 10% чернил или на жестком диске этого сервера 20%).

Его недостатком, вероятно, является плотность информации на компьютер, не поймите неправильно, у него ОЧЕНЬ много данных на машину, но для таких вещей, как серверы, где вам может понадобиться много статистики, вам может потребоваться другой инструмент.

РЕДАКТИРОВАТЬ: о, я уже упоминал, что его бизнес-модель основана на том, чтобы быть бесплатным навсегда.

Копчение не только проверяет доступность различных серверов и служб, но также отслеживает их задержку, обеспечивая простоту использования, красивый внешний вид и быстро отображать графики.

Из коробки доступен широкий спектр плагинов для измерения задержки. Если вы немного знаете Perl, то легко создать свой собственный для любых экзотических нужд.

Большие установки выиграют от системы ведущий / ведомый для распределенных измерений.

Легко настраиваемая система предупреждений поможет вам заметить проблемы до того, как они начнут влиять на пользователей или перерастут в серьезный сбой.

Smokeping - бесплатное ПО с открытым исходным кодом, написанное на Perl Тоби Оетикером, создателем MRTG и RRDtool.

Ядро Зеносса отчасти полезен, мы используем его (около года) для облегченного мониторинга серверов, сетевых коммутаторов и ИБП.

Zenoss Core - это отмеченный наградами продукт для мониторинга ИТ с открытым исходным кодом, который эффективно управляет конфигурацией, работоспособностью и производительностью сетей, серверов и приложений с помощью единого интегрированного программного пакета.

OpenNMS используется там, где я работаю, для мониторинга более тысячи машин Linux. Мы отслеживаем оборудование каждой машины и запущенные на ней приложения.

Я использовал:

  • Nagios - требует некоторой устаревшей настройки командной строки, некрасивой, но прочной и функциональной. Его заменили:
  • Зенос - требует гораздо меньше усилий для настройки, есть коммерческий вариант. После запуска все остальное контролируется через браузер. Очень мощный, но требует некоторой работы с MIB, если вы используете бесплатную версию.
  • Intermapper - коммерческая программа, дорогая, если у вас много узлов для мониторинга. Похоже, что он написан на Java (хорошо это или плохо).
  • Spiceworks - не пробовал последнюю версию. Старым версиям требовалось немного больше шума под капотом, чтобы заставить его реагировать, но в остальном он работает хорошо. Бесплатная версия поставляется с назойливой рекламой.

Nagios великолепен, поскольку он бесплатный и для него есть множество плагинов. Однако пользовательский интерфейс и конфигурация очень сложны.

Это полная противоположность плюсов и минусов, что также здорово, так это Microsoft System Center Operations Manager (SCOM), который не является бесплатным, имеет меньше плагинов, но установка и настройка великолепны и просты.

Я должен признать, что если бы я работал в основном в компании Microsoft, имел очень высокие требования к надежности (то есть не мог позволить себе сломать мониторинг) или мне приходилось думать о том, чтобы заставить разработчиков работать с ним, то SCOM был бы моей рекомендацией по сравнению с Nagios.

Мы используем AlertFox уже несколько недель и очень этому рада. Он не только проверяет время безотказной работы и производительность, но также отслеживает корзину покупок, логин пользователя и другие важные части веб-сайта с помощью скриптов транзакций (на основе iMacros).

Для нашего внутреннего мониторинга (дисковое пространство и т. Д.) Мы используем Nagios.

PRTG Network Monitor - не могу сказать достаточно хороших слов об этом. Великолепный веб-интерфейс, особенно подходящий для мониторинга маршрутизаторов (пропускная способность и т. Д.) И других устройств через SNMP и измерения времени безотказной работы для SLA и т.

www.paessler.com

Как человек Windows, MOM. Мы планируем выполнить обновление до Systems Center Operations Manager (SCOM), но в этом нет необходимости, пока мы не начнем развертывание Windows 2008.

Я удивлен, что никто не упомянул журнал или проверка журнала для серверов Linux - экономит массу времени на чтение журналов !!

Для мониторинга статистики (использование памяти, загрузка, активность mysql, активность apache и т. Д.) Я использую Мунин. По умолчанию он уже отслеживает множество вещей и строит графики для разных временных интервалов (последние 24 часа, последние 7 дней, последний месяц, последний год). С помощью плагинов можно контролировать еще больше вещей. На выходе получаются HTML-страницы с красивыми графиками.

Munin имеет архитектуру мастер / узел: узлы собирают статистику на сервере, а мастер хранит данные и создает HTML и графики.

я использую Монит для отслеживания запущенных процессов и для перезапуска или предупреждения меня при возникновении определенных настраиваемых условий (высокая загрузка процессора, высокое использование памяти, отсутствие ответа HTTP и т. д.) Monit также может отслеживать более общие вещи о сервере, такие как загрузка процессора, память использование, состояние жесткого диска или использование диска.

Monit необходимо настроить для каждой службы или оборудования, за которым вы хотите следить, и для каждой реакции, когда что-то идет не так. Наиболее часто используемые варианты - ничего не делать, отправить электронное письмо с предупреждением или перезапустить службу.

Monit великолепен, когда он работает, но иногда ему не удается запустить, остановить или перезапустить службу, а диагностической информации, которая поможет вам определить, что пошло не так, не так много. Это означает, что вы не знаете, была ли проблема в вашей службе или в конфигурации Monit, которая работает в минимальной среде, подобной cron.

Оба инструмента доступны по умолчанию в большинстве дистрибутивов Linux.

Я участвую в проекте модернизации системы оперативного мониторинга. К нам приходили разные поставщики, чтобы представить несколько дорогостоящих систем и смешивать их с более дешевыми альтернативами для сравнения.

Один из которых Гиперический, который также доступен как бесплатное решение с открытым исходным кодом. Я был впечатлен предоставляемыми возможностями и расширяемостью для настраиваемых агентов.

Наш проект использует Ганглии для наших кластеров из 100+ узлов. Одна из причин, по которой мы его используем, заключается в том, что это инструмент мониторинга, который поставляется с Горные породы.

Для нас важно иметь очень низкие накладные расходы на каждом узле, чтобы для вычислений было доступно как можно больше ресурсов. Ganglia дает нам хороший обзор кластера и позволяет при необходимости детализировать отдельные узлы. Помимо того, что мы знаем, что происходит прямо сейчас, мы можем довольно хорошо взглянуть на то, что произошло за последний час, день, неделю, месяц и год. Графики различной статистики являются базовыми и функциональными.

я использую Pingdom для мониторинга моего сервера. Он отправляет мне SMS-сообщение, когда сервер недоступен.

Все зависит от того, что вы подразумеваете под «монитором»!

  • Доступна ли она (система или услуга)? Мы используем нагиос.
  • Что он делает? Мы используем Мунин для серверов Linux и кактусы почти для всего остального, хотя иногда сложно настраивать ...
  • Что он сделал? Мы используем syslog-ng, чтобы сосредоточить системные журналы в одном месте, а затем ежедневно запускать настраиваемый сценарий logcheck для отправки отчетов по электронной почте. Ищем нечто подобное для серверов Windows.

Новым участником на сцене, который хочет проверить себя на предмет конкуренции с Cacti и решениями на основе RRDTool, является Graphite (http://graphite.wikidot.com/)

RRDTool заменяется резервным хранилищем под названием Whisper. Документы дают довольно хороший обзор того, почему они отличаются, и мне очень нравится CLI для специального построения графиков при исследовании чего-либо.

Если вы спешите и вам нужен быстрый инструмент для мониторинга вашего сервера MS, используйте монитор производительности для Windows, настройте журнал счетчиков с настраиваемым шаблоном мониторинга и индивидуальным расписанием (например, собирайте данные в течение 5 минут каждый час). Затем загрузите Microsoft LogParser и Codeplex Performance Analysis of Logs (PAL) Tool (http://pal.codeplex.com/), чтобы обработать журнал счетчиков. PAL сгенерирует отличный документированный отчет со ссылками на возможные документы / инструменты для решения проблем.

Хоббит - это более быстрая и улучшенная версия Большого Брата (которая в наши дни кажется тревожно коммерческой).

http://hobbitmon.sourceforge.net/

В настоящее время мы используем PRTG от Paessler. Отлично. Никаких агентов не требуется, отличный веб-интерфейс Ajax, ведение журнала, построение графиков, WMI и т. Д. И т. Д. Есть версия с 10 датчиками, доступная бесплатно, но мы выложили пару тысяч за корпоративную версию. Деньги потрачены не зря.

Для тех, кому не нравится веб-интерфейс Nagios, есть NPC, плагин для Cacti, который делает пользовательский интерфейс Nagios доступным из Cacti, но с улучшенным внешним видом (ajax и т. д.).

Он читает из базы данных, предоставленной NDO2DB, что является отличным способом сделать вашу инфраструктуру доступной из базы данных для использования в скриптах и ​​других инструментах.

Мы используем (и нравится) Что происходит из Ipswitch для нашей относительно небольшой сети Windows. Его легко настроить и относительно легко управлять, и он знает, как работать с серверами Windows, а также со стандартными вещами.

Для больших сетей, сетей, не ориентированных на Windows, или сетей с большим количеством разнообразных вещей я настоятельно рекомендую OpenNMS. Программное обеспечение OpenNMS, если оно бесплатное, и компания более чем рада продать услуги поддержки и внедрения. Также бывает, что он запускается очень острым друг мой из колледжа!

Zabbix (http://www.zabbix.com) тоже хорош, и его проще настроить, чем Nagios.

Мы используем OpsView, который работает поверх Nagios. Веб-интерфейс помогает нам развертывать новые определения монитора хоста без необходимости разрешать доступ по SSH, предоставляет общедоступные представления и записывает исторические значения. Это удобно для подготовки и определения подходящих исходных условий.

Я использую комбинацию Solarwinds, вкладок производительности сервера VMware и пользовательских скриптов.

Монитор производительности сети Solarwinds Orion - это то, что я использую с нашей системой Windows. админы на моих веб-серверах. На нем все еще работают некоторые полезные метрики приложения, но есть хорошая информация о базовых вещах на уровне коробки (диск, сеть, процессор).

Из моих гостей VMware мне нравятся вкладки производительности.

Для моих серверов Sun, когда мне нужно что-то, чего нет в Solarwinds (потому что наш администратор не добавил это или что-то еще), я пишу собственные сценарии (обычно на Perl) для отслеживания таких вещей, как состояние зеркала, использование подкачки и т. Д.

Я бы хотел больше узнать о Solarwinds, но в сутках всего около 26 часов (по крайней мере, так считает мой босс), так что я считаю, что это может быть небольшим ограничением ...

Извините, но в итоге я использовал множество пользовательских скриптов. Хотя он далек от идеала, я сомневаюсь, что есть более распространенное решение.

Мы написали собственное программное обеспечение для мониторинга. Наш код не такой сложный, как коммерческий пакет, но нам и не нужно было много функциональности. Было проще написать свой собственный, чем исследовать другие пакеты и научиться их использовать. Код делает то, что мы хотим, и его легко расширить.