Назад | Перейти на главную страницу

Должен ли системный администратор делать резервные копии важных данных каким-либо образом, даже если он не согласен со стратегией резервного копирования?

Недавно вышел из строя один из основных файловых серверов нашей компании. Он использовал 4-х дисковый RAID-массив, но, очевидно, 3 диска умерли, и все данные на сервере были потеряны.

В разговоре с системным администратором он говорит, что уже несколько месяцев предупреждает высшее руководство о ситуации с резервным копированием. Он пытался получить одобрение на покупку решения для резервного копирования корпоративного уровня, но так и не получил одобрения бюджета на него, потому что руководство считало это чрезмерным.

Системный администратор является специально сертифицированным системным администратором, тогда как его менеджеры не ориентированы на ИТ.

Его менеджер спрашивает, почему он не купил дешевый внешний диск и не использовал его для резервного копирования файлового сервера. Системный администратор считает, что это просто решение с микки-маусом, которое подходит для использования дома, но не в профессиональной ИТ-компании, поэтому он этого не сделал.

Мне кажется, что системный администратор хочет правильную ИТ-стратегию из учебников, которая стоит намного больше денег, тогда как руководство (без глубокого понимания ИТ) хочет более дешевых решений, которые они считают адекватными.

Мне интересно, что думают другие системные администраторы? Правильно ли поступил этот системный администратор? Или ему всегда следует делать резервную копию важных данных, даже если он считает, что более дешевый способ недостаточно хорош?


Изменить: основываясь на ответах, я добавлю, что у системного администратора есть ИТ-менеджер, который знал бы о ситуации. Он подчиняется главному боссу. Я не знаю, сообщал ли когда-нибудь менеджер всю ситуацию боссу. Я думаю, что это довольно непросто для менеджера, поскольку он застрял посередине и хочет быть дипломатичным с обеими сторонами.

Я согласен, что делать это правильно - предпочтительный метод. Но стоять в стороне и ничего не делать непрофессионально. Было ли руководство проинформировано об отсутствии резервной копии? Задача администратора - представить руководству варианты, включая затраты и риски. Он представил предпочтительный вариант, а когда ему было отказано, ничего не сделал. Не круто.

Я бы честно сказал, что это провал с обеих сторон.

Логистика ситуации может означать, что ему придется отнять время, которое он должен был бы потратить на выполнение других, немедленных, важных задач.

Однако, в конце концов, да, он должен был что-то сделать. Куча жестких дисков отсюда и там было бы лучше, чем ничего, как уже неоднократно говорилось.

С другой стороны, вся цель менеджмента - убедиться, что люди, стоящие ниже вас, могут делать свою работу и делают. Таким образом, с точки зрения лидерства, менеджеры потерпели неудачу и могут нести равную, если не большую, ответственность.

Если нет резервных копий, насколько я понимаю, ответственность системного администратора:

1) Четко и недвусмысленно скажите вышестоящему руководству, что резервных копий НЕТ, чтобы они знали об этом.

2) Сделайте резервную копию данных в любом случае, как он может

Честно говоря, я ожидал, что меня уволят, если это произойдет, потому что даже если руководство усложняет мою жизнь, это не оправдание, особенно если они все еще думают, что у них есть что-то а не ничего.

Будь проклят, если ты это сделаешь, и проклят, если нет. Откровенно говоря, если руководство не потратило денег на решение для резервного копирования, то это их вина. С другой стороны, администратор должен был быть активным в попытках выработать временное решение, а не просто сидеть на заднице, ожидая, что что-то сломается (я не думаю, что какое-либо решение для внешнего диска приемлемо. никогда не получится получить достойную поддержку с этим.) Вы не можете просто сказать: «Ну, у меня нет того, что я хотеть, так что я не несу ответственности "но ты жестяная банка скажите: "Я неоднократно пытался заставить вас сделать что-то и ты дал мне ничего и это не моя проблема ».

Однажды я действительно был в ситуации - я даже не был АДМИНИСТРАТОРОМ на этой работе - когда я работал с базой данных и делал резервную копию, прежде чем изменить ее (что является подачкой), и я (как я обычно делаю по возможности) сохранил его на своей локальной машине. Через два дня они потеряли массив рейдов и, упс, оказалось, что решения для резервного копирования нет. Они делали резервную копию базы данных к рейдовый массив.

Итак, я пришел к этому поздно и говорю: «О, я сам подтвердил это позавчера».

Вы знаете, каков был результат? Меня порицали за мой плохое решение для резервного копирования. Для машины, за которую я не нес никакой ответственности. И не потому, что у меня была слишком старая резервная копия, а потому, что я сделал резервную копию только той базы данных, над которой работал, а не каждый база данных.

Итак, проблема в следующем: если вы решите проблему с микки-маусом, если вы сделаете что-нибудь, и это будет недостаточно хорошо, вы получите такой же ад, как если бы вы вообще ничего не делали. Если резервное копирование является вашей явной обязанностью, и у вас нет бюджета, вам следует попытаться что-то сколотить, но вам лучше убедиться, что это работает, и вам нужно поднять на себя ад. Неоднократно. При любой возможности.

Если это не ваша ответственность, укажите, что проблема существует, и абсолютно, категорически, отказываться взять на себя ответственность за необеспеченный мандат, когда они попытаются передать его вам. Никто не делает аварийное восстановление приоритетом, пока не произойдет авария, а затем они станут козлами отпущения всех, чтобы попытаться восполнить свою близорукость.

К сожалению, компании слишком часто экономят на резервном копировании. Большинство никогда не меняются, пока не сгорят и не потеряют все.

НО

Если вас наняли системным администратором, вам придется работать с имеющимися у вас инструментами, включая свой мозг. Независимо от того, что руководство или кто-либо другой говорит в хорошие дни, когда фекалии ударяют по поклоннику, каждый получает избирательную память.

Резервная копия с Микки Маусом лучше, чем ее отсутствие.

Для меня это звучит так, как будто сисадмин хотел все или ничего. Приятно получить все, но если у тебя нет, не принимать ли ничего?

По моему опыту, нужно оценить все возможные варианты (не слишком глубоко) и составить несколько пунктов для каждого с указанием плюсов и минусов, затрат (как начальных, так и текущих). Включите сюда вариант «ничего не делать».

Затем вы позволяете менеджерам решать, какое решение они выберут. Мне кажется, что у вашего системного администратора было, вероятно, несколько вариантов. Возможно, он видел только ту, которую действительно хотел?

Добавлю свой голос к тем, что админ должен был реализовать что-то Вот. Он сильно виноват в том, что этого не сделал. Часть меня хотела бы сочувствовать его положению, но в идеальном мире резервное копирование и восстановление не занимали бы времени, всегда работали и никогда не понадобились бы. Это не тот мир, и даже лучшее решение для резервного копирования будет иметь недостатки, которые вам нужно будет принять и научиться работать с ними.

Недолговечный лучше, чем беззеркальный, и даже использование дешевого USB HD вытащило бы его из леса и придало бы вес его положению, когда руководству сказали, что они не могут получать данные больше, чем за сутки. или два старых назад. Но в этом случае это все равно спасло бы его шею.

Если системный администратор каким-либо образом может сделать резервную копию важных данных.

Я не знаю, могу ли я сказать, что вам следует сделать резервную копию под любые условия. У вас может возникнуть соблазн сделать некоторые вещи, которые могут оказаться незаконными. Например, я бы не стал делать резервные копии медицинских записей по сети на свой персональный компьютер. Я бы не стал делать что-то незаконное, чтобы иметь резервную копию.

OTOH, чтобы иметь хоть какую-то систему резервного копирования, я бы пошел на множество компромиссов. Затем всякий раз, когда был достигнут компромисс, я делал упор, чтобы убедиться, что мои возражения ясны и задокументированы, почему это был плохой компромисс, который вызовет проблемы, будет неадекватным или станет менее полезным в будущем.

Как системный администратор я считаю своей обязанностью обеспечить максимальную безопасность и надежность систем, находящихся под моей опекой, насколько это возможно. Резервные копии подпадают под теги надежности. Как ни неприятно спорить с непонятливым старшим персоналом (я думаю, что все мы были там когда-то), мы все равно должны делать свою работу как можно лучше.

Когда система резервного копирования, унаследованная мною на моем нынешнем посту, вышла из строя, и руководство не решалось тратить деньги на систему, которую я хотел, я не оставил систему без резервных копий. Вместо этого я принес свой личный внешний диск и использовал его около недели. Несмотря на абсолютное отвращение к использованию жестких дисков для резервного копирования, факт остается фактом: это было намного предпочтительнее, чем вообще иметь их.

Если системный администратор не смог убедить руководство в важности хорошего решения для резервного копирования, единственный способ его убедить - это катастрофическая потеря данных, но как системный администратор вы обязаны информировать руководство и пользователей о важности таких вещей, как резервное копирование. , и убедиться, что они полностью понимают текущее состояние (в данном случае «нет резервных копий») и возможные последствия («Мы потеряли диск, и ваши драгоценные данные исчезли навсегда»).

Мое личное мнение состоит в том, что администратор здесь как бы облажался: специальные резервные копии - плохая идея (вы пропустите вещи, важные данные будут потеряны, если вас нет рядом, резервных копий не произойдет), но в то же время раз они должны были найти надежное "корпоративное" решение для резервного копирования в рамках бюджета компании.
Программное обеспечение, подобное Bacula и Аманда доступен бесплатно, и оба они могут безопасно и надежно работать со съемными USB-носителями и компакт-дисками. Включая стоимость носителей и серверного оборудования, вы можете получить хорошую систему менее чем за 2000 долларов США - даже дешевле, если вы утилизируете оборудование для сервера.

Теперь, если руководство также выступает против административных расходов ВРЕМЯ в создании резервных копий этой компании просто не помочь: как я уже сказал выше, иногда единственный способ научить людей - это катастрофическая потеря данных, и в этом случае это отстой для бедного администратора, который должен взять на себя вину за институциональную глупость.

Мое личное мнение таково, что моя работа как системного администратора - информировать и внушать руководству необходимость и важность наличия адекватного, подходящего решения для резервного копирования и запрашивать необходимый бюджет для такого решения, а также объяснять риски, связанные с невыполнением этого требования. В мои обязанности не входит выходить «за рамки» полномочий руководства и просто делать то, что я считаю правильным, независимо от того, насколько плохи эти управленческие решения. В мои обязанности не входит приготовление недоделанного, недоработанного решения.

Если бы я был страховым агентом и сказал вам, что в полисе вашего домовладельца важно включить покрытие от пожара, и если бы я адекватно объяснил риск отсутствия страхового покрытия от пожара, и вы отклонили указанное покрытие от пожара, и ваш дом сгорел, кто ответственность это? Должен ли я все равно прикрывать вас от пожара?

Я считаю, что системный администратор проявил должную осмотрительность при выполнении своих обязанностей, доведя вопрос до сведения руководства, объясняя важность наличия соответствующего решения для резервного копирования, объясняя риски его отсутствия и запрашивая необходимый бюджет для такой. Если его усилия были отвергнуты, ответственность полностью ложится на плечи руководства.

Люди постоянно принимают неверные решения, и из-за этих неправильных решений случаются плохие вещи, это факт жизни. Я не могу нести ответственность за каждое плохое решение, которое принимает мой начальник, независимо от рисков, связанных с этими решениями.

Такая же ситуация случилась с RAID-массивом? Как только один диск умирает, вы попадаете в ситуацию, когда еще один означает потерю данных ... вам лучше немедленно заменить этот диск.

Если бы я был на месте системного администратора, то в момент первого диска:

  1. Менеджер электронной почты с официальным запросом на замену диска, напоминающий, что система резервного копирования не была одобрена, поэтому это критическая ситуация. Укажите предыдущие запросы системы резервного копирования, приложив это электронное письмо, или, что еще лучше, ответ менеджера, отклоняющий запрос.
  2. Если нет ответа, повторно отправьте сообщение, на этот раз отправив копию менеджеру вашего менеджера.
  3. Если по-прежнему нет ответа, что ж ... вы мало что можете сделать. Отшлифуйте резюме и начните искать работу получше.

Если вам откажут в пути, по крайней мере, вы получите это в письменной форме на тот случай, когда дерьмо попадет в поклонника (Получите это в письменной форме / по электронной почте, не принимайте устный ответ. Здесь вам нужен документальный след. Если ваш менеджер отказывается писать затем пройдитесь по его / ее голове, потому что это просто сомнительно - нет законной причины не записывать это.)

Тот же самый процесс должен был быть использован для получения резервной системы, хотя, возможно, без такой быстрой эскалации (или вообще через голову вашего менеджера). Если ни одна просьба не написана, ну .. говно катится под откос. По крайней мере, это хороший жизненный урок.

Если вы не потеряете работу из-за этой ситуации, то начните снова подавать этот запрос, ссылаясь на катастрофу, которую он вызвал в последний раз, когда ваш запрос был отклонен. Если это все еще отрицается, вам нужно решить, стоит ли вам работать в такой среде, и стоит ли это напрячь. Если каждое утро вы ожидаете, что придете на работу в панике из-за потери данных, что ж, это не способ жить.

Компания явно ищет в этом козла отпущения: системный администратор совершенно прав, не создавая резервных копий критически важных данных на съемное устройство.

1) Они ненадежны 2) Они небезопасны

В конечном итоге ответственность за то, что не было применено надлежащее решение аварийного восстановления (DR), лежит на менеджерах.

Посмотрите на это с другой стороны: во сколько эта потеря данных обошлась компании? Внезапно я уверен, что решение «сверху вниз» не выглядит таким дорогим.

edit: да, я признаю тот факт, что любая резервная копия более надежна, чем никакая, но моя исходная точка зрения остается, если у этого человека есть менеджеры, менеджеры должны убедиться, что резервная копия была на месте, я не прощаю системного администратора за всю вину здесь, но это то, что менеджер должен проверить.

А что, если сервер вышел из строя и данные на съемных дисках по какой-либо причине невозможно было восстановить? у меня такое случалось в прошлом. USB-накопители далеки от надежности, но для некоторых их можно использовать в крайнем случае, проблема заключается в том, что в этом случае кажется, что управление разрешенным резервным копированием съемных дисков будет использоваться в течение длительного времени. запустить.