Назад | Перейти на главную страницу

Безопасно проводите тесты, требующие отключения сервера

Итак, в основном я тестирую и диагностирую свои ИБП, а также источники питания (БП) моего сервера. Для этой цели Я выключаю сервер "сложным путем", отсоединяя его от стены как имитировать потерю мощности.

Я делал это так, как описано, и помог мне найти, какие ИБП не работают должным образом, а также какие блоки питания нужно изменить (если сервер выключается, что-то нужно изменить, в остальном все в порядке). Тем не мение, Я начинаю беспокоиться, что постоянное отключение моего сервера от сети и его жесткое "убийство" может нанести некоторый ущерб ему или моим данным.

Это подводит меня к моему вопросу: Есть ли альтернативный способ проведения этих тестов, чтобы минимизировать вероятность повреждения сервера или его частей? Или нет проблем с тем, чем я сейчас занимаюсь?

Опять же, я пытаюсь определить, какие источники питания неисправны (то есть ИБП в порядке, но сервер все равно умирает при отключении от сети). ИБП я ​​могу протестировать самостоятельно, чтобы не пытаться использовать этот метод с сервером, но я не могу понять, как проверить, может ли мой блок питания справляться с колебаниями и всплесками, не проверяя их на реальном сервере. Приветствуются любые рекомендации.


Рассматриваемый сервер: HP ProLiant DL380 G7 сервер, с Intel Xeon. У меня также есть это с RAID 1 уровень на жестких дисках. Оно имеет Ubuntu 16.04.3 LTS работает на его SSD.

У вас есть HP ProLiant DL380 G7. Посмотрите на следующее:

Дисплей Systems Insight Display (SID) показывает состояние внутренних компонентов.

Если на любом из блоков питания горит желтый свет: на SID или на реальных физических модулях, существует проблема.

Вы также можете войти в ILO сервера, чтобы проверить интегрированный журнал управления. Если вы внезапно потеряете питание, в журнале может быть запись, указывающая что-то вроде:

- Server reset.
- Server power removed. 
- Server power restored.

У вас есть возможность не подключать оба источника питания к одному ИБП. Подключите один к электросети и наблюдайте за поведением.

Проверьте прошивку в вашей системе. Серверы G7 сейчас старые, но при запуске Ubuntu вам, вероятно, не хватает агентов отчетности и управления HP (они оптимизированы для RHEL / CentOS / VMware / Windows). Вы можете скачать полный комплект прошивки для данной модели с помощью этот загрузочный DVD HP.

Два примечания:

Во-первых, лучший способ подключения ИБП - это двойной источник питания ваших серверов. В случае отказа питания или ИБП (батареи) все остается включенным.

Во-вторых: за исключением того, что было сказано об ослаблении позиций, неплохо отключить сервер (если вас не волнует повреждение данных), кроме SSD. В зависимости от того, какие SSD у вас могут быть, он может иметь суперконденсатор, чтобы справиться с этим. Но потеря мощности может повредить блоки, которые стираются или записываются.

Правка про двойной блок питания: правильный путь - один блок питания в стене, другой - через ИБП. Неправильно было бы подключать только один блок питания или соединять их оба через ИБП. Если вы это сделаете, то при неудачном самотестировании ИБП питание прервется, и вы не сможете отключить его для замены батареи.

Конечно, с серверами без двойного блока питания такой роскоши не будет.

Не отключайте ИБП от сети. Я задал похожий вопрос 9 лет назад на этом сайте и получил следующий ответ от Эван Андерсон:

ИБП теряет электрическое заземление, когда вы отсоединяете его от сети. Хотя маловероятно, что что-то пойдет не так, разработчики ИБП «ожидают», что этот путь к заземлению будет оставаться доступным в любое время, и если что-то произойдет во время вашего теста, вы можете увидеть искры (дым, пламя и т. Д.), Когда электричество потребует другого путь к земле. Раньше я отключал ИБП от стены для тестирования, но увидев вспышку «молнии» и услышав громкий «хлопок», исходящий из ИБП во время одного из таких тестов, я почувствовал «веру» в то, что больше не делать этого.

Поэтому, если вы используете розетку с переключателем, выключите ее. Если у вас нет переключаемой розетки, подумайте о том, чтобы переключить питание на прерыватель, чтобы цепь заземления оставалась подключенной.

Что касается отключения серверов путем выдергивания вилок, вы не должны причинять физический ущерб машинам, делая это. Вы можете повредить RAID-массивы без батарейного питания или нарушить запись во время полета, что может вызвать беспорядок в файловых системах и потерю данных, но с вашими физическими серверами все должно быть в порядке.

Что касается твоего актуальный Проблема заключается в том, что во время отключений / отключений электроэнергии / скачков напряжения вы все равно теряете свои серверы перед ИБП, есть несколько причин, которые могут вызвать это:

  1. Если у вас есть два источника питания на ваших серверах, и один из них подключен к ИБП, а другой нет (что достаточно часто), у вас может быть неисправность переключения блока питания внутри сервера.
  2. Опять же, если у вас два источника питания, возможно, один из них перегружен, и сервер отключается по соображениям безопасности.
  3. В зависимости от типа имеющегося у вас ИБП он может работать некорректно. Однажды у меня был сайт, на котором были постоянные отключения - от 20 до 30 раз в день мощность падала ниже 200 В (обычно 230 В), и ИБП переходил в режим повышенного напряжения, а иногда напряжение поднималось до 250 В, и ИБП переходил в режим пониженного напряжения. Режим. Это резко сократило срок службы традиционных ИБП (я обычно использовал ИБП около года). Мы перешли на ИБП с двойным преобразованием (также называемый ИБП онлайн), который решил эту проблему.