Какие изменения, которые вы внесли, оказали наибольшее влияние на экономию времени при ежедневной рабочей нагрузке системного администратора? Какие у вас уловки, чтобы работать эффективнее и делать больше или меньше работать с теми же результатами?
Я думаю об автоматизации, изменениях в рабочем процессе / процессах, новых инструментах, прекращении каких-либо дел в целом, аутсорсинге, улучшении делегирования, изменении программного / аппаратного обеспечения, сокращении бюрократии и т. Д.
мониторинг + оповещение - что является большой подстраховкой. Так же, как разработчики пишут модульные тесты, чтобы убедиться, что все не испортится при обновлении кода, я полагаюсь на мониторинг как на дополнительную подстраховку на случай, если я что-то испорчу [например, отключите сервер, запретите производственный трафик на брандмауэре и т. д.] . это дает душевное спокойствие - если что-то сломается, я буду знать до того, как клиенты позвонят.
Для меня это была централизованная аутентификация.
Я дошел до того, что администрировал около 40 машин Slackware, и каждая из них имела локальную аутентификацию ПЛЮС локальную аутентификацию Samba. У меня также было решение VPN, в котором необходимо было настроить каждую учетную запись, плюс внутренний сервер jabber и внутренний сервер электронной почты. У всего был свой счет. MAC (ходы, добавления, изменения) были безумными.
Поэтому я переключился с Slackware на CentOS, создал инфраструктуру Active Directory и использовал Likewise Open для аутентификации всех моих Linux-машин в AD. Это, наверное, сэкономило мне 20 часов в месяц, даже не шутя.
Теперь у меня есть все, что я могу аутентифицировать через AD, и это отлично работает. Я не могу рекомендовать централизованную аутентификацию, если вы все еще делаете что-то по-старому.
Я согласен с очевидным выбором здесь; Автоматизация и централизованная аутентификация. Тем не менее, похоже, что я должен быть тем парнем, который должен упомянуть документация.
Задокументировав как можно больше проблем, рабочих процессов, установок и руководств, люди смогли проработать некоторые из своих проблем без необходимости привлекать к этому наш отдел.
Еще одна отличная экономия времени - отслеживание проблем.
Возможность расставлять приоритеты задач, назначать их членам команды и избавляться от всего беспорядка людей, отправляющих запросы по электронной почте, MSN или просто приходящих в офис. Это также помогает нашим хорошим друзьям, менеджерам видеть, насколько вы эффективны (если хотите).
Тогда, конечно же, вишенкой на торте будет моя кружка RTFM (прочтите руководство), которую часто поднимают.
Автоматизация инфраструктуры с помощью такого инструмента, как Повар или Кукольный это лучшее, что я реализовал в системах, которыми я управляю. Мониторинг - это прекрасно и все такое, но часто для того, чтобы заставить различные биты работать с остальной инфраструктурой, требуется много работы. Chef и Puppet отлично умеют автоматизировать всю инфраструктуру, предоставляя много связующего материала, который раньше писали вручную. В частности, собрать вместе, какие серверы и какие услуги предоставляют.
Chef имеет встроенную возможность запрашивать у сервера атрибуты и рецепты, применяемые на других узлах, поэтому вы можете спросить, кто такие производственные веб-серверы или кто является хозяином базы данных, что значительно упрощает автоматизацию. Puppet тоже может это сделать, но для этого требуется внешний инструмент классификации узлов, например iClassify.
Это должно иметь очевидные последствия для инструментов мониторинга и отслеживания тенденций, таких как Nagios и Munin. Он также может, например, обеспечивать автоматическую настройку сред с балансировкой нагрузки, чтобы LB могли запрашивать все веб-серверы, которые должны быть покрыты для конкретного приложения.
Еще одно средство экономии времени, которое я реализовал в различных средах, - это автоматические сборки, такие как kickstart (redhat / centos) и preseed (debian / ubuntu). Это должно быть очевидно для большинства людей, но может быть удивительно, сколько сайтов все еще строят системы с компакт-дисков. Еще лучше, если автоматическая сборка подготовит систему к запуску Chef или Puppet, чтобы подготовить все остальные продукты.
Несколько мониторов с открытым окном на консоли каждого сервера, за который я отвечал.
Мониторинг, конечно, хорош, но не уверен, что это экономия времени. На мои деньги это было централизованное ведение журнала с системой просмотра, которая отфильтровывала обыденное, выделяла опасные (сбой диска, обнаружение вирусов) и отображала все остальное для категоризации.
syslog (и perl) для победы.
Это в основном позволяло мне читать журналы событий всех компьютеров в сети, пока я ел рогалик; хотя бы беглую проверку на предмет чего-нибудь страшного. Огромная экономия времени.
Виртуализация (VMware)
Между развертыванием серверов из шаблонов, управлением серверами из единого интерфейса, детальным мониторингом оборудования, встроенным в клиент инфраструктуры, это действительно изменило способ администрирования нашей инфраструктуры.
И влияние, которое он оказал на то, как мы думаем о нашем «оборудовании», действительно изменило правила игры. Кластеры больше не «слишком дороги», потому что мы можем развернуть их виртуально. Нужно больше серверов Citrix, клонируйте его. Пока мы поддерживаем нашу физическую аппаратную ферму, обеспечивающую адекватные ресурсы (а эти серверы теперь действительно являются товаром), все отлично.
Удалены права локального администратора для всех пользователей. (если я могу)
Это привело к тому, что теперь мне не нужно иметь дело ни с одним из: как мне установить приложение X (потому что вам это не разрешено сейчас), на моем компьютере есть вирус / шпионское ПО, мой компьютер работает медленно и почти все, что с этим связано.
Я никогда не рассказывал о том, насколько стабильными это делало рабочие станции, пока я не наткнулся на одну рабочую станцию, которая была полностью пропущена при аудитах, обновлениях Windows и т. Д. Она работала около 4 лет без единого обновления. Я думаю, что это было на Windows SP1. Этот сайт ни разу не жаловался на какие-либо проблемы с ним, и когда я его обнаружил, то обнаружил, что он отлично работает.
Для меня это было нанять очень хорошего системного администратора.
cfengine для управления конфигурацией в debian / linux.
openvpn для подключения спутниковых станций
tighvnc через VPN для доступа к 2300 клиентам Windows на спутниковых станциях.
Мунин и нагиос для мониторинга и отчетности
smartmontools на серверах для автоматических проверок работоспособности (и сообщений о состоянии, если что-то пойдет не так)
raid1 (зеркальное отображение) на серверах. Если один диск выходит из строя, сервер все еще работает - это очень важно для моего тайм-менеджмента.
Командная работа - Самостоятельно все делать бесполезно. делитесь работой, и вместе вы станете более продуктивными.
рабочая атмосфера Уважайте своих товарищей, шутите и смейтесь - это очень полезно для создания позитивной и творческой атмосферы.
Приятной работы! чувак, я люблю свою работу! Это заставляет меня погуглить (я думаю;))
Кукольный. Идея изменения один место и наличие всех затронутых систем - это фантастика.
Добавьте к этому стандартные установки, и очень быстро установить новую систему. Вы загружаетесь по сети и запускаете стандартную установку, а затем марионетка вступает во владение и все настраивается.
Наконец, стандартизируйте. Нет, вам действительно не нужны 35 разных дистрибутивов Linux и 4 разные версии Solaris. Работа по переходу на одну стандартную установку. Каждая уникальная система, которую вы отключаете, экономит ваше время.
До сих пор я больше всего экономил время на SSH-ключи + ssh-agent + keychain, как описано в этом Статья IBM об управлении ключами OpenSSH
Больше никаких паролей для оболочек, скриптов и scp.
ПРИМЕЧАНИЕ. В моем закрытом ключе все еще есть кодовая фраза.
Несколько лет назад я реализовал Wiki для ИТ-отдела (использующий Mediawiki для заинтересованных лиц). Когда мы начали привыкать к нему, на многие вопросы, которые задавали в офисе, мы ответили: «Вы проверяли вики?» Нам потребовалось немного времени, чтобы привыкнуть к проверке конкретной информации в Wiki, но как только мы это сделали, мы поняли, что это большой потенциал. Вся необходимая информация всегда под рукой - если чего-то нет, у нас есть возможность быстро добавить / изменить страницу.
Экономия времени наиболее важна, когда системы не работают.
Я задокументировал всю информацию о контракте на поддержку в стандартизированных текстовых файлах в стандартной структуре каталогов. У меня была одна центральная и более одной копии.
Каждому биту информации (веб-портал, номер телефона, контактное лицо, срок действия, номер контракта, ярлыки меню телефона и т. Д.) Предшествует стандартный тег в старом формате .ini (tag: data).
Найти номер телефона было так же просто, как перейти в каталог верхнего уровня и запустить:
grep Phone */*support.txt | more
Если первый подстановочный знак расширился до названия поставщика и / или продукта.
Я не использовал Excel, Word, OpenOffice, базу данных и т. Д. И т. Д. Просто потому, что когда что-то выходит из строя, это что-то может быть именно тем, что содержит вашу информацию поддержки. Кроме того, их нелегко просмотреть с экрана консоли в текстовом режиме.
Я также задокументировал все инструкции таким же образом.
Самая большая экономия времени, которую я реализовал, - это создание образа диска для наших производственных рабочих станций. Все они одинаковы, и никто ничего не хранит локально, поэтому, если возникнет проблема, я просто заново создаю образ машины, и все готово к работе, как новое.
Добавьте еще один голос за мониторинг. Принцип довольно прост: я хочу знать, что происходит, до того, как это затронет пользователей. Системное администрирование в идеале должно быть прозрачной ролью. Пользователи не должны ни знать, ни заботиться о том, что вы делаете. С их точки зрения, это должно просто работать. Счастливые и довольные пользователи должны равняться счастливым и довольным администраторам.
В ИТ часто упускают из виду то, что компьютеры работают на нас, а не наоборот. Тем не менее я знаю администраторов, которые проводят значительную часть своего дня вручную, проверяя свои серверы и журналы. Зачем? Компьютеры могут отслеживать друг друга, и с помощью небольшого скрипта вы можете получить только интересную часть журналов. На самом деле, вам не нужно пробираться через несколько миллионов информационных записей, таких как задание печати Фреда или передача DNS была успешной. Просто скажи мне, когда это не так.
Научитесь делегировать полномочия своим коллегам и доверять им - когда вы знаете, что можете передавать часть работы другим людям, жизнь становится намного более расслабленной. И не потому, что я ленив и заставляю всех делать мою работу за меня; это душевное спокойствие, которое приходит со знанием того, что у вас есть надежная резервная копия. И, конечно же, хорошо контролируемые стандартизированные конфигурации ОС на стандартном оборудовании. Само собой разумеется.
Моей целью для автоматизации всегда было то, что теперь я снова получаю электронное письмо с сообщением: «То-то и такое-то сломалось на сервере foo. Это было исправлено». а затем, как только я отправлю ошибку разработчикам, я могу вернуться к чтению газеты и пить кофе. Мы еще не достигли цели, но мы прошли долгий путь от реактивного хаоса, с которым мы боролись каждый день.
++ для централизованной аутентификации и управления учетной записью, включая создание учетной записи и обработку прекращения. У нас есть AD (два леса) и LDAP (и до недавнего времени NDS) с различными группами, обращающимися к ресурсам, существующим в любом каталоге. Время, которое мы потратили на синхронизацию каталогов и на управление всеми ресурсами в том или ином каталоге, окупилось.
Следующей по величине победой стала любая степень автоматизации, будь то очистка учетной записи, централизация конфигурации или что-то еще.
Я не уверен, сколько времени на самом деле экономит мониторинг, но это важно. Для того, чтобы среда стала достаточно большой или сложной, чтобы «ручная проверка» стала невозможной и неэффективной, не требуется много времени. К тому же иногда приятно поспать. ;)
Это может быть немного не в духе основной мысли по этому поводу, но мы также добились огромной победы, когда стандартизировали нашу аппаратную платформу. Мы выбрали серверную платформу, которая была совместима со всеми нашими внутренними ОС, и придерживались ее в течение нескольких лет. Мы изучили оборудование и научились удаленному управлению им, что позволяет экономить время и энергию различными способами:
То же самое касается стандартных, документированных и проверенных сборок ОС. Может показаться простым, но я часто сталкиваюсь с магазинами, где сборки нестандартны, и нет конца возиться, чтобы увидеть, присутствует ли этот инструмент или этот инструмент, или правильно ли настроен конкретный сервер. Такой хаос может превратить даже самые простые задачи и проблемы в утиль.
я нашел AutoIt и позже AutoHotkey и влюбился.
Последней моей работой был производитель нестандартных автомобилей. Ассемблеры были минимально опытными пользователями компьютеров и сумели вывести из строя программу, которую они должны были использовать, чтобы указать, на какой работе они были. Ежедневно, несколько раз в день, мне приходилось обходить более 15 рабочих станций в 3 разных зданиях и останавливать сбойную программу, перезапускать ее и возвращать на экран ввода данных. В конце концов я установил VNC, так что я мог делать это удаленно, что сократило время в пути, но все же заставило меня не забывать заходить и перезагружать машины время от времени. Когда я нашел AutoIt, я понял, что могу настроить программу так, чтобы она смотрела на компьютер, и если в течение 5 минут не было никакого ввода, она могла бы сбросить программу, ввести и щелкнуть все необходимое, чтобы вернуть ее на экран ввода. Это сэкономило мне по крайней мере час в день и очень обрадовало финансистов, поскольку меньше людей жаловалось на то, что компьютеры не работают, и больше людей вводили данные о своей работе.
Я должен согласиться с pQd по поводу мониторинга.
Хотя мы еще не увидели всех преимуществ, реализация управления конфигурацией с помощью Puppet обещает сэкономить нам значительное количество времени и значительно сократить количество ошибок.
Я недавно реализовал AntHill Pro на работе, и теперь все наши сборки и развертывания для ряда проектов полностью автоматизированы и отслеживаются. Это включало создание общей библиотеки Ant для развертывания Tomcat, которую используют все проекты, что упростило обслуживание этих проектов в AHP. Далее создается аналогичная библиотека для развертываний CDA на сайте.
Хотя это не экономит мне время лично, это экономит время наших разработчиков и нашего операционного персонала. Мне нравится быть масленкой для чужих колес. :-)
Я надеюсь, что в следующий раз я посмотрю на Chef и Puppet, которые помогут автоматизировать инфраструктуру.
О, и документация - ОГРОМНАЯ помощь. Если просто указать людям на хорошо написанный документ, это сэкономит много времени, а не 20 раз ответить на один и тот же вопрос.
Больше всего мне сэкономили время скрипты preseed для установки наших рабочих станций Linux. к нам постоянно приходят и уходят подрядчики, поэтому у нас есть пул рабочих станций, которые повторно используются на регулярной основе. Когда они возвращаются в ИТ-отдел, мы вставляем установочный компакт-диск, добавляем файл preseed в команду установки, и в течение 20 минут (и никаких дальнейших нажатий клавиш от кого-либо из нас) коробка возвращается к новой, рабочей базовой установке со всем инструменты и предварительно настроены для работы в нашей сети. Plug'n'play.