Я уже давно думал о том, чтобы начать работу с программным обеспечением для мониторинга, но, похоже, никогда не начинал с ним хорошо.
я слышал Nagios - довольно приличное решение с открытым исходным кодом для этого, но я никогда не мог должным образом начать с ним.
Есть ли у кого-нибудь советы с некоторыми хорошими подходами к началу мониторинга сервера? Я думаю о таких вещах, как количество сетевых подключений, средняя нагрузка, возможно, пропускная способность, используемая сервером, и т. Д. В основном задействованы основы (которые могут включать основы, о которых я не знаю).
Основы мониторинга nagios - это такие вещи, как ping и SNMP. В Ubuntu доступен целый ряд пакетов для поддержки nagios, отслеживающих поиск nagios с помощью apt-cache.
Следует отметить, что SNMP обычно развертывается небезопасно, поэтому не раскрывайте никаких строк записи и не отправляйте ничего, о чем вы не хотите, чтобы кто-либо / что-либо еще в сети узнало.
UbuntuGeek публикует прохождение настройки nagios.
Для построения графиков долгосрочных тенденций мы используем OpsView, который издает подходящие репозитории для их веб-интерфейса.
После того, как вы установили его, я бы порекомендовал следующее, чтобы быстро начать работу:
Это позволит вам сразу же получить результаты. Как только вы решите проблемные области, начните применять проверки ко всем известным службам (http, https, проверка сертификатов ssl, pop3 и т. Д.).
Для долгосрочного тренда серьезно подумайте о таком инструменте, как Кактусы. Это отлично подходит для сбора информации SNMP в Unix и Windows (при использовании Windows убедитесь, что вы установили бесплатный Информатор SNMP) и позволяет увидеть, как он изменяется с течением времени.