Нам часто приходится решать такие вопросы, как:
server x
?license x
истечь?host x
?feature x
?Как вы, ребята, справляетесь с этими вопросами? Есть ли инструмент или программное обеспечение, которые помогают вести точный учет всех или большинства этих предметов?
Я могу сказать вам, что не работает: наличие отредактированного вручную документа, электронной таблицы, веб-страницы или вики.
Мне еще не приходилось видеть организацию, достаточно строгую, чтобы вручную поддерживать ее техническую документацию на 100% точной и актуальной. Неточная документация не только раздражает; это просто опасно. Что произойдет, если кто-то забудет отметить это service a
работает на server x
? Если вы доверяете документации, вы получите неожиданный простой service a
.
Первая часть решения - автоматизировать процесс с помощью платформы мониторинга, такой как Xymon, Nagios или Zabbix (есть много других). Эти платформы можно расширить с помощью пользовательских скриптов, чтобы ответить на большинство вопросов о вашем программном и аппаратном обеспечении. Платформа мониторинга гарантирует, что эта автоматическая документация будет обновляться.
Вторая часть решения - иметь механизм, который предупреждает вас о неполном покрытии. Например, я использую специальный сценарий, который перечисляет все процессы, запущенные в системе, отфильтровывает процессы, которые отслеживаются или игнорируются, и предупреждает меня о любых неожиданных событиях - это говорит мне, что пришло время добавить эти новые процессы в Платформа мониторинга. Другой пример - сопоставить статус вашего порта Cisco с информацией CDP, чтобы убедиться, что вы охватили все свои серверы.
Большим преимуществом этого подхода является то, что вы делаете документацию и получаете бесплатные оповещения и тенденции.
Я думаю, что отображение разума - неплохая идея. Я использую Drupal с GraphMind модуль.