Назад | Перейти на главную страницу

Автоматически отслеживать новые облачные серверы с помощью Open Monitoring Distro (OMD)?

Я потратил некоторое время на то, чтобы разобраться, используя Nagios, Check_mk и некоторые другие очень полезные инструменты, установленные как часть пакета OMD.

WATO особенно полезен для администрирования всех наших статических серверов на базе Windows и Linux через графический интерфейс после того, как агент check_mk установлен вручную.

Я хотел спросить, как лучше всего автоматизировать весь этот процесс мониторинга? Или даже если это можно сделать?

Мы будем использовать рецепты от шеф-повара для регулярного предоставления новых серверов и частого отключения других. Если мы собираемся продолжать использовать Nagios / Check_mk, тогда важно, чтобы усилия администратора были минимальными для отслеживания и мониторинга нашей инфраструктуры.

Большое спасибо за вашу помощь. Стив

На высоком уровне есть два пути:

  • Сделайте так, чтобы шеф-повар записал действительные файлы конфигурации Check_MK (это уже было сделано), и пусть он запускает инвентаризацию + перезагрузку через автоматизацию WATO. Это, наверное, более прозрачно.
  • Заставьте Check_MK читать хосты из вашей CMDB (если вы запустите профессиональную установку, она будет одна ...) или из конфигурации Chef. Это возможно, конфигурация Check_MK позволяет вам практически все, что позволяет Python. Таким образом, вы можете читать данные из LDAP, некоторого API, конфигурации Chef или плоского файла. Для меня это более чистый подход, поскольку он имеет более прямой интерфейс «данных».

Я думаю, что в конечном итоге первый путь в любом случае сработает для вас лучше, поскольку он больше ориентирован на WATO. Я бы все равно выбрал второй и подключился к списку виртуальных машин EC2 и тому подобное.

Возможен гибрид, например, с некоторыми демонами, которые прослушивают такие события, как создание виртуальной машины, и записывают конфигурацию в папку WATO только для чтения.

Примечание. Было бы очень глупо не проверять работоспособность любого такого источника данных. Просто потому, что некоторая инфраструктура как сумасшедший код добавляет (инфраструктура) ошибка и удаляет 100% ваших виртуальных машин из Chef, их не следует немедленно удалять из мониторинга.

Убедитесь, что он остается маленький из группы.

Документ 2010 года о динамическом взаимодействии Check_MK можно найти здесь: https://geni-orca.renci.org/trac/wiki/OMDeventhandlers

Он действительно старый, но хорошо отражает основные идеи.

Я сделал первое подтверждение концепции интерфейса config-mgmt --- to ---- Check_MK. Не так хорошо, как хотелось бы, но ограничивается только моей скоростью / навыками написания Python. :)

Использую с ок. не облачные 70 серверов сейчас: https://bitbucket.org/darkfader/nagios/src/461992c2c5452807a37838ca99fd92977fcf96e1/check_mk/ino2cmk/ino2cmk.py?at=default