Как небольшая организация с ограниченными ресурсами проводит тест на восстановление своей системы резервного копирования данных?
Уговорка «Проверь свои резервные копии!» кажется нереалистичным, когда сталкиваешься с реальностью того, что может включать в себя полномасштабный тест восстановления, не затрагивая основные системы.
Предположим, у организации нет резервных серверных мощностей на десятки тысяч долларов, которые можно просто выделить для временного развертывания полной тестовой среды, чтобы убедиться, что ночные резервные копии можно восстановить.
Есть ли способ оправдать покупку всего основного оборудования во второй раз, просто для ежегодного тестирования восстановления, но в противном случае оно остается в хранилище, выключено и не используется?
В других обсуждениях сбоя сервера при тестировании восстановления носителя предлагалось использовать отдельный ленточный накопитель для подтверждения того, что носитель можно использовать на другом устройстве.
Для небольшого предприятия, имеющего всего несколько серверов и один производственный ленточный накопитель, кажется трудным оправдать покупку дополнительного ленточного накопителя LTO-7 за тысячи долларов и дополнительных лицензий на программное обеспечение резервного копирования, которое будет поставляться вместе с ним, просто чтобы использовать его для один раз в год процесс восстановления носителя / проверки среды тестирования, а затем положите его на полку и не используйте до процесса тестирования в следующем году.
Вы тестируете свои резервные копии в первую очередь для проверьте свои процедуры восстановления чтобы в кризисной ситуации вы точно знали, что делать, а когда все будут паниковать, вы будете компетентны, уверены в себе, спокойны и точно знаете, что делать, и примерно сколько времени займет восстановление и т. д. и т. д. ... потому что к тому времени восстановление резервных копий - обычное дело.
Второе, что вы, вероятно, захотите сделать, это проверка целостности данных, можно ли будет возобновить производство после восстановления критически важных данных? Нет ничего поврежденного или неполного?
Вы можете и, вероятно, должны тестировать обе эти вещи по отдельности. Только когда вы освоите основы, вы можете попытаться восстановить весь центр обработки данных.
Если вы делаете резервные копии файловых систем и сетевых ресурсов, например, подходящим тестом будет восстановление определенного каталога в другом месте и сравнение размеров файлов, хэшей и разрешений с оригиналом.
В следующий раз, когда вам нужно будет клонировать базу данных для тестирования, вместо этого восстановить производственная база данных из резервной копии.
При необходимости выполните восстановление ОС на виртуальной машине с нуля.
Но резервное копирование и восстановление - это лишь один из аспектов более крупной стратегии аварийного восстановления и плана обеспечения непрерывности бизнеса.
Что будет делать ваш бизнес, если ваше текущее местоположение будет потеряно из-за стихийного бедствия (пожар, наводнение, ураган и т. Д.)? Может ли он продолжать работу из других существующих мест, или это ваше единственное место, бизнес просто обанкротится или деньги по страховке будут использованы для аренды офисов / контейнеров для экстренных случаев?
Такова была стратегия BCP пару лет назад в одной компании: контракт с HP или, может быть, IBM в то время, на поставку центра обработки данных в контейнере один раз в год для полных тестов аварийного восстановления центра обработки данных, а также с тем, чтобы он находился в режиме ожидания. случай острых бедствий.
У этой компании было 1 офисное помещение и только ленты за пределами площадки (или, может быть, магнитофон) и все остальное внутри компании. Идея заключалась в том, что аренда временно меблированных офисных помещений, подключение к Интернету и перенаправление телефонных номеров, получение настольных компьютеров, принтеров и т. Д. Было бы в основном товаром и легко организовать. Но ЭТО чуть менее. Расчет рентабельности для двухцентрового центра обработки данных был неблагоприятным.
Таким образом, сначала каждые 6 месяцев, а затем один раз в год они проводили полный тест BCP, но на временно арендованном оборудовании: развертывание VMWare, восстановление резервного сервера, восстановление виртуальных машин с помощью контроллеров домена AD, почтовых серверов, баз данных и серверов приложений. и файловые ресурсы.
Более современная стратегия BCP может быть основана на облаке и с локальной резервной копией в Интернете, и вы также тестируете восстановление после аварийного восстановления в облаке, если они вам понадобятся всего пару дней, даже довольно большое количество виртуальных машин не сможет Взломать банк.
Перефразируя старую пословицу
катастрофа неизбежна, восстановить - не совсем
Короче бэкап и тесты восстановления являются абсолютной необходимостью. Чтобы иметь хороший план резервного копирования и восстановления, я хотел бы подчеркнуть следующие моменты:
tar
) или, что еще лучше, используйте rsync
(или аналогичный инструмент) для резервного копирования ваших данных на уровне файловой системы. С помощью таких инструментов вы можете очень легко проверить свою резервную копию и сразу понять, все ли (или большинство) присутствуют / доступны или нет.Для быстрого и экономичного восстановления критически важно в достаточной мере использовать временные виртуальные машины, работающие на дешевом оборудовании (читай: выведенные из эксплуатации серверы или рабочие станции). Если дисковое пространство является проблемой, широко используйте thin provisiong. Если проблема связана с доступной оперативной памятью, каждый раз восстанавливайте только небольшое подмножество ВМ (даже одну).
For a small site with only a few servers and a single production tape drive, it seems hard to justify buying an additional LTO-7 tape drive for thousands of dollars and additional licensing for the backup software to go with it, just to use it for a once-per-year media restore / test environment verification process and then stick it on a shelf and don't use it until next year's test process.
Большинство компаний на самом деле этого не делают. Причина в том, что они предполагают, что в маловероятном случае, когда им потребуется замена оборудования для резервного копирования в случае полной и катастрофической потери, они могут приобрести необходимое оборудование и получить его в течение нескольких часов (по цене). Таким образом, ваш план не обязательно должен включать в себя покупку резервного оборудования, программного обеспечения, лицензий и т. Д.