У нас есть Windows Server 2003, работающий как веб-сервер в удаленном центре обработки данных. Вчера вечером я установил большую партию обновлений Windows, а затем около 1:30 запустил перезагрузку через RDP. Перезагрузка не удалась, и хотя сервер все еще работает, мы заблокированы через RDP. Паника и хаос!
Я не перенаправлял приложения на другую машину (что возможно лишь частично с оборудованием, которое у нас есть в настоящее время), потому что несколько часов простоя для обновлений посреди ночи приемлемы для наших клиентов.
На данный момент я поддерживаю связь с персоналом центра обработки данных, чтобы перезагрузить машину другими способами поздно вечером, но, очевидно, я хочу избежать этого в будущем.
Мои вопросы:
Детали машины:
Заранее спасибо. Дополнительная информация по запросу.
ОБНОВИТЬ:
Вот несколько отличных ответов.
Для удаленного управления некоторые предложили использовать KVM и удаленное управление питанием по IP или оборудование, такое как HP iLO или Dell DRAC. У нас есть серверы HP, поэтому я посмотрю на iLO. К сожалению, наш хостинг-центр имеет KVM over IP для всех своих машин, но не разрешает доступ клиентам, поскольку он не настроен надежно. Выбирая будущие услуги хостинга, я позабочусь о том, чтобы этого не произошло.
Для профилактики mh предложил остановить службы и закрыть сеансы, которые могут препятствовать перезагрузке. В нашем случае это, вероятно, позволило бы определить проблему и предотвратить ее. Похоже, что экземпляр VMware, на котором запущена наша промежуточная среда, не был выключен, и это остановило перезапуск основного сервера.
Джон Гарденерс предложили выполнить перезагрузку вручную после установки обновлений и не позволять Центру обновления Windows выполнять перезагрузку. Я сделаю это в будущем.
Спасибо всем.
Существует несколько вариантов удаленного доступа к консоли без использования RDP в рабочей установке Windows:
Lights Out Management - некоторые серверы от Sun, HP, IBM и некоторых других имеют чип управления Lights Out (LOM). У меня большой опыт работы с Технология HP iLO что сэкономило мне несколько поездок. По сути, этот чип дает вам удаленный доступ с проверкой подлинности к элементам управления на передней панели сервера и многим другим вещам. Обратной стороной является то, что если на вашем сервере его нет, вы не сможете его использовать.
IP KVM или удаленное управление питанием - несколько поставщиков предоставляют продукты, которые позволяют удаленно получать доступ к клавиатуре, видео и мыши (IP KVM) или менее дорогостоящая возможность удаленного управления питанием путем выключения и повторного включения сетевого питания сервера через PDU. Последний вариант не рекомендуется, если вы не уверены, что просто выключите и снова включите сервер.
Последний вариант - не устанавливать обновления в ночное время и запланировать короткие отключения в течение дня, когда вы или ваши «руки и глаза» можете быть в центре обработки данных, чтобы решить любые проблемы. На самом деле это происходит по прихоти вашего клиента, хотя время простоя в квартал часто является хорошим дополнением к вашим договоренностям.
Эта перезагрузка была частью установки исправлений? У меня было несколько случаев, когда разрешение процессу обновления выполнить перезагрузку приводило к тому, что машина в конечном итоге не выключалась полностью, как вы описали. В большинстве случаев все, что требовалось, - это нажатие клавиши или движение мыши, хотя на экране не было подсказки. К сожалению, это всегда происходило, когда меня не было в офисе. В наши дни я использую сценарий для установки обновлений, но не разрешаю перезагрузку в конце. Перезагрузка выполняется отдельно. С тех пор у меня больше не было проблем.
Если у вас сервер Dell или HP, вы можете выполнить удаленный аппаратный сброс с помощью контроллера BMC (Dell) или ILO (HP). И у Dell, и у HP есть более дорогой вариант с удаленной клавиатурой и экраном. С Dell вы устанавливаете карту DRAC, а с HP, я думаю, вам просто нужно установить лицензионный ключ, чтобы активировать дополнительные функции.
Если сервер не Dell или HP, вы застряли. Некоторые другие серверы имеют аналогичные удаленные контроллеры, но многие нет. Серверы иногда передаются при перезапуске, часто без видимой мне причины. Единственный другой вариант - использовать сервер только для запуска виртуальных машин, убедиться, что он не видит Интернет, и никогда не обновлять его (или только в контролируемых условиях). Если виртуальная машина не перезапускается чисто, ее легко перезапустить с хоста.
JR
У меня раньше была такая же проблема в нашем центре обработки данных, к счастью, у меня была карта iLO на моих серверах HP и DRAC в моем ящике Dell, однако в одном из ящиков, на котором это произошло, не было удаленного управления. единственное, что я мог сделать, это позвонить в центр обработки данных и спросить, может ли кто-нибудь из их ребят выключить и включить меня.
При перезагрузке сервера первое, что я всегда делаю, - это проверяю, что присутствую во время перезагрузки. Если я не могу присутствовать физически, по крайней мере, мне нравится иметь возможность пинговать его, чтобы я мог наблюдать, как он опускается и возвращается вверх.
Перед перезагрузкой останавливаю службы. Как можно больше, гарантируя, что только самый базовый список сервисов запущен и работает в то время, когда он выходит из строя. Это включает в себя любые веб-сайты, электронную почту, антивирус, агентов безопасности и тому подобное. Большинство случаев «зависания при отключении», которые я видел, можно напрямую отнести к тому, что служба застревает в состоянии «остановки» во время перезагрузки, и это позволяет избежать этого. Это единственное наиболее полезное занятие, и, к сожалению, не существует окончательного списка применимых повсюду служб, которые нужно остановить; здесь требуется опыт и ваше собственное знание того, что находится на сервере.
Затем я проверю, есть ли другие сеансы RDP, которые могут все еще зависать. В отключенном, но еще не завершенном сеансе может быть загружен профиль пользователя. Также проверьте наличие других активных подключений к серверу.
Затем я перезагружаюсь, и во время перезагрузки я запускаю командную строку и пингую -t. Обычно на этом этапе мне не нужно видеть, что отображается на экране, хотя это может быть полезно, если у вас есть необходимые предпосылки.
Иногда, если сервер зависает во время перезагрузки, я мог получить к нему доступ через Управление компьютером и, как я сказал выше, найти службу, застрявшую в состоянии «Остановка». Здесь может пригодиться удаленная утилита "kill".
В большинстве случаев мы перезагружались, как только были применены исправления. Установка патчей и ожидание более подходящего момента для перезагрузки вызвали только проблемы. Все остальные предоставили отличные, проверенные и надежные методы перезагрузки заблудшего компьютера. МОТ и DRAC великолепны, использование инструмента выключения PSTools тоже хорошая идея. Я обнаружил, что иногда обычные методы терпят неудачу, но использование чего-то вроде VNC или Dameware позволяет мне войти в систему и сбросить ее.
Если у вас есть 2 удаленных сервера (и при условии, что они могут общаться друг с другом), на другом сервере вы можете запустить
Shutdown /m \\Server /r /c "Remote Restart" /t 30
(Для Win2000 был RCMD (часть набора ресурсов), который меня пару раз спасал, но я больше не думаю, что это вариант).
Одна вещь, о которой не упоминалось, но которая была полезна для меня по крайней мере в двух случаях, которые я помню, - это WakeOnLAN - если у вас есть хотя бы два сервера в одной локальной сети в вашем центре обработки данных.
См. Этот вопрос здесь, на Serverfault.com: Инструмент пробуждения по локальной сети для Windows
Обычно мы используем удаленный рабочий стол Windows для удаленного администрирования, но у нас также есть Radmin (http://www.radmin.com/) на большинстве наших удаленных серверов. В редких случаях система будет доступна через Radmin, но не через RDP. Это может спасти жизнь. Вы также можете попробовать VNC. Конечно, вам придется учитывать аспекты безопасности любого из них.