Я провожу полевые исследования на нескольких компьютерах под управлением Ubuntu, выполняю критически важные задачи и выполняю полевые исследования. Компьютеры имеют аналогичную конфигурацию с небольшими вариациями.
Поскольку в прошлом у нас были некоторые проблемы с конфигурацией, мой босс настаивает на том, чтобы мы сделали образ установки на каждом компьютере и восстановили этот образ на каждом компьютере, прежде чем они отправятся в поле.
Я предпочел бы написать общий сценарий, который проверяет правильность конфигурации системы и ее работоспособность. Если компьютер был проверен, не является ли восстановление этой конфигурации избыточным? И есть ли с этим какие-то проблемы?
Мое нежелание проистекает из того факта, что наше программное обеспечение и конфигурация могут быть изменены в полевых условиях, но эти изменения должны быть внесены на всех компьютерах. Это означает, что при внесении изменений все образы восстановления также должны быть обновлены. Различия в конфигурации каждого из компьютеров находятся в / etc. Если требуется восстановление, я бы предпочел сохранить один образ, содержащий все, что является общим для всех машин, и иметь моментальный снимок каталога / etc каждого компьютера, который будет использоваться для восстановления состояния этой конкретной машины.
Какой подход лучше?
Похоже, что вам действительно нужна система управления конфигурацией, такая как puppet. При правильной настройке он должен проверять, что все правильно, при каждом запуске марионетки.
Периодическая переустановка систем только для того, чтобы привести их в известное состояние, на самом деле не является необходимой, и, похоже, это создаст много работы, которую вам никогда не нужно делать. Когда у вас много систем Linux, гораздо лучше иметь действительно базовую автоматическую установку, а затем иметь систему, которая извлекает все правильные конфигурации для данного узла после определения уникального имени / идентификатора системы.
Если вы можете виртуализировать эти серверы, вы можете периодически возвращаться к базовому снимку, который был сделан после того, как все было проверено. Это имеет то преимущество, что гарантирует известное состояние, поскольку управление конфигурацией работает, но не гарантирует возврата к известному состоянию всего сервера.