Я немного посмотрел на другие вопросы, и ни один из них не ответил на то, что мне нужно было знать. Какие шаги мне следует предпринять для построения эффективной стратегии аварийного восстановления как для серверов, так и для рабочих станций?
Здесь я говорю о настройке резервных копий, фан-систем и тому подобном.
Я ищу рекомендации, которые я мог бы передать своему начальнику, в идеале с «изящным удешевлением» решений.
IE: Мы не можем позволить себе быстро установить замену на случай, если наш сервер выйдет из строя (как это было только что), и у нас нет возможности сохранить запасные части на случай, если дерьмо попадет в вентилятор. В идеале я бы предложил мощный аппаратный RAID на двух контроллерах домена, а затем менее дорогие варианты, а затем самый дешевый из доступных. Сейчас мы делаем еженощные резервные копии с общего диска на другой, и он подключен к компьютеру моего коллеги.
Я почти уверен, что самый дешевый вариант будет лучшим в глазах моего босса, но я хочу убедиться, что он понимает, насколько важно, чтобы мы получили то, что нам нужно для поддержания серверов и рабочих станций в рабочем состоянии.
Просто чтобы быть ясным на 10000%.
ВАШ СЕРВЕР ДОЛЖЕН ИМЕТЬ RAID также, RAID НЕ ЯВЛЯЕТСЯ РЕЗЕРВНЫМ.
Это покрыто - VMWare упрощает аварийное восстановление сервера. Вы можете создать скрипт для ежедневного снэпшота и копирования всего вашего сервера VMDK (виртуальных дисков) на другую рабочую станцию или дешевое сетевое устройство хранения. В случае сбоя вашего сервера ESX / ESXi вы можете запустить ESXi на ноутбуке в крайнем случае или на дешевом сервере. Не было бы ни перенастройки, ни восстановления, ни небольшой настройки.
По моему опыту работы с клиентами, настольные рабочие станции обычно умирают из-за проблем, не связанных с жестким диском. Если блок питания выйдет из строя и поджарит ваш жесткий диск, он поджарит их обоих, если у вас был RAID.
Моя рекомендация для рабочих станций:
Мои рекомендации по серверам:
Сервером резервного копирования может быть старый ПК в офисе, дешевый контроллер SATA и 3 диска по 1 ТБ в RAID5. Общие затраты на резервное копирование машины на сервер резервного копирования с объемом памяти 2 ТБ должны составлять <500 долларов США.
После того, как у вас есть план и реализация - ПОПРОБУЙ ЭТО. Затем запланируйте регулярные тесты.
Что касается запасного оборудования - я думаю, что на небольшой выборке машин вы обнаружите, что отказ является полностью случайным. Наличие дополнительного жесткого диска и блока питания может никогда не пригодиться. Я бы держал под рукой запасную настроенную рабочую станцию и при необходимости просто заказывал детали в Newegg.
Глава 21 «Практики системного и сетевого администрирования» дает вам те подробности, которые вам действительно необходимы. понять бэкапы, особенно стратегия.
Помните: резервное копирование происходит не только тогда, когда ваш сервер загорается или выходит из строя диск. И RAID не является решением для резервного копирования, RAID - это аппаратное решение для аварийного переключения. Резервные копии существуют, когда вы или ваши пользователи случайно удаляете файлы, которых у них не должно быть. Резервные копии предназначены для случаев, когда какое-либо программное обеспечение повреждает файлы или вносит изменения, которых на самом деле не должно быть. Резервные копии также предназначены для архивных целей, например, для журналов аренды DHCP, чтобы, когда полиция постучала и сказала: «Мы обнаружили незаконную активность X, исходящую с IP Y на дату Z, 4 месяца назад. У кого был этот IP?»
Кроме того, резервные копии не обязательно должны быть дорогими, но даже если они стоят, они стоят в 10 раз больше, когда у вас их нет. Наш сервер резервного копирования использует дешевое бытовое оборудование, жесткие диски вместо магнитной ленты и находится на месте (в центре обработки данных, который находится в подвале, который, по-видимому, рассчитан на близость взрыва атомной бомбы).
Дешевые / недорогие ресурсы (без определенного порядка)
КНИГА - Резервное копирование и восстановление (Недорогие решения для резервного копирования для открытых систем) http://oreilly.com/catalog/9780596102463
Сначала получите ПЛАН ... на самом деле получите ТРИ ... затем поговорите со своим боссом и позвольте ему "выбрать" один.
Clonezilla - бесплатный способ резервного копирования / создания образа диска.
JungleDisk - Недорогой (и простой) способ резервного копирования важных файлов за пределами офиса.
Что касается оборудования ... это всегда будет проблемой. Если у вас отказал блок питания ... вам нужен новый. Если ваша материнская плата умирает ... вам нужна новая ... Если ваша ... вы поняли.
И я уверен, что все будут кричать об этом, но помните ... RAID - это НЕ РЕЗЕРВНАЯ КОПИЯ! :-)
Только вы (и ваш босс) сможете определить, стоит ли ваше время простоя (и время восстановления) иметь сервер «горячего резерва» или просто несколько общих запасных частей.
Если вы ДЕЙСТВИТЕЛЬНО пытаетесь сохранить дешевизну ... по крайней мере, купите себе USB-накопитель емкостью 1 ТБ примерно за 80 долларов и используйте clonezilla каждые ___ дней / недель для резервного копирования сервера.
Я думаю, что главное здесь - придумать план (или несколько вариантов), а затем разумно поговорить со своим начальником. Расскажите ему о плюсах и минусах каждого варианта, а затем позвольте ему решить, как ему действовать дальше.
Насколько я знаю, мне ни в коем случае не понадобятся:
Для резервного копирования данных
- Аппаратный RAID
- Репликация сервера
- Внешнее резервное копирование, предоставленное третьей стороной или самодельное
Для стабильности системы
- Резервное копирование системы (с использованием Ghost или аналога)
- Единое оборудование на максимально возможном количестве рабочих станций
- Основные запасные части для оборудования, которое, скорее всего, умрет раньше