Я потратил некоторое время на то, чтобы разобраться, используя Nagios, Check_mk и некоторые другие очень полезные инструменты, установленные как часть пакета OMD.
WATO особенно полезен для администрирования всех наших статических серверов на базе Windows и Linux через графический интерфейс после того, как агент check_mk установлен вручную.
Я хотел спросить, как лучше всего автоматизировать весь этот процесс мониторинга? Или даже если это можно сделать?
Мы будем использовать рецепты от шеф-повара для регулярного предоставления новых серверов и частого отключения других. Если мы собираемся продолжать использовать Nagios / Check_mk, тогда важно, чтобы усилия администратора были минимальными для отслеживания и мониторинга нашей инфраструктуры.
Большое спасибо за вашу помощь. Стив
На высоком уровне есть два пути:
Я думаю, что в конечном итоге первый путь в любом случае сработает для вас лучше, поскольку он больше ориентирован на WATO. Я бы все равно выбрал второй и подключился к списку виртуальных машин EC2 и тому подобное.
Возможен гибрид, например, с некоторыми демонами, которые прослушивают такие события, как создание виртуальной машины, и записывают конфигурацию в папку WATO только для чтения.
Примечание. Было бы очень глупо не проверять работоспособность любого такого источника данных. Просто потому, что некоторая инфраструктура как сумасшедший код добавляет (инфраструктура) ошибка и удаляет 100% ваших виртуальных машин из Chef, их не следует немедленно удалять из мониторинга.
Убедитесь, что он остается маленький из группы.
Документ 2010 года о динамическом взаимодействии Check_MK можно найти здесь: https://geni-orca.renci.org/trac/wiki/OMDeventhandlers
Он действительно старый, но хорошо отражает основные идеи.
Я сделал первое подтверждение концепции интерфейса config-mgmt --- to ---- Check_MK. Не так хорошо, как хотелось бы, но ограничивается только моей скоростью / навыками написания Python. :)
Использую с ок. не облачные 70 серверов сейчас: https://bitbucket.org/darkfader/nagios/src/461992c2c5452807a37838ca99fd92977fcf96e1/check_mk/ino2cmk/ino2cmk.py?at=default