Я работаю с командой достаточно умных людей с разумным набором навыков для выполнения поставленной перед ними задачи (поддержка руководителей операций). Без сомнения, из-за обстоятельств и вверенного им обучения они проявляют мало инициативы и боятся сделать что-нибудь не так.
Теперь компания решила, что эта команда присоединится к дежурной ротации. На первой встрече, посвященной этому обсуждению, по их взглядам и вопросам стало ясно, что ответственность за решения во время чрезвычайных ситуаций их очень тревожит. Боюсь, что в такой ситуации они могут замерзнуть.
Как мне заставить их открыться и взять ситуацию под контроль при возникновении чрезвычайной ситуации? У кого-нибудь есть прямой опыт с этим?
редактировать: Речь идет о системном администрировании (jboss, websphere, mysql и т.д.), но я понимаю, что это может быть более применимо к форуму управления. Однако, поскольку я ищу практический опыт из окопов, я полагаю, что serverfault все еще применяется. Моя главная забота заключается в том, чтобы как можно скорее не выполнить резервное копирование систем.
Кроме того, поскольку отдел довольно молод, у нас нет точного представления о том, что, скорее всего, пойдет не так. Это, конечно, еще больше усугубляет ситуацию.
Edit2: Все очень хорошие ответы, я просто выберу тот, который лучше всего подходит для меня.
Лучшее, что вы можете сделать, - это иметь хорошие модули Runbook. «Если произойдет A, сделайте B». Каждое предупреждение от мониторинга должно иметь процедуру, даже если эта процедура - «Позвонить Бобу в:». Боб должен знать, что если он хочет, чтобы вызовы прекратились, ему необходимо создать процедуры или инструменты.
Для операций NOC часто бывает полезно «обучить» новых членов команды, попросить их поработать за столом с опытным человеком в течение 2-3 недель.
Убедитесь, что все в команде осведомлены о том, что если люди первой линии поддержки повышают свою квалификацию, они должны помочь им даже неправильно. Будьте готовы жестко наказать любых людей из службы поддержки 2-го уровня, которые не отвечают или плохо обращаются с NOC лично при их эскалации. (Это серьезная проблема, человек второго уровня будет возмущаться любым вторжением в свое свободное время, но, если они не будут реагировать, NOC станет «пугливым» и прекратит эскалацию или будет избегать эскалации до этого человека.)
Найдите и, возможно, отправьте их на тренинг по Система управления инцидентами. На конференции Cascadia IT Conference 2011 Брент Чепмен выступил с прекрасным докладом на тему «Чему мы можем научиться у пожарной службы». Некоторые слайды и материалы с его презентации на другом месте могут быть найдено здесь.
В основном пожарная часть и другие люди, ответственные за реагирование на чрезвычайные ситуации, имеют очень структурированный набор методов для принятия решений и выполнения действий в чрезвычайной ситуации.
Как мне заставить их открыться и взять ситуацию под контроль при возникновении чрезвычайной ситуации?
Одна из рекомендаций Brent заключалась в том, чтобы люди отвечали за координацию какого-либо крупного проекта или модернизации. Суть в том, чтобы поручить им главные дела в более контролируемой среде, тогда они будут лучше подготовлены к работе в более хаотичной ситуации, когда что-то ломается.
Помимо других респондентов, в точных предложениях есть второе лицо, более привыкшее к принятию решений, которое также дежурит на переходном этапе, чтобы с ним тщательно проконсультировались. Человек, оказывающий основную поддержку, не должен чувствовать, что разговор со второстепенным «усиливается». Вместо этого дайте понять, что вопросы ожидаются.
Им всем хорошо за это платят? Помимо того факта, что отношение большинства людей к вещам радикально меняется, независимо от того, получают ли они вознаграждение за свои усилия или нет, обратите внимание, что в некоторых странах дежурство по вызову без оплаты является совершенно незаконным.