Мы столкнулись с очень странной проблемой в серверной нашего нового офиса со всеми розетками.
В частности, когда все оборудование запущено и работает (т. Е. Система кондиционирования воздуха, 2 сервера в стойке, 5 коммутаторов PoE с 48 портами, а также система доступа к дверям, у которой есть резервные батареи и основные схемы управления, расположенные внутри серверной комнаты) время от времени мы видим, как серверы самопроизвольно перезагружаются, система доступа к дверям перезагружается, а коммутаторы PoE одновременно переходят в нефункциональное состояние на 20 минут и более. Когда это происходит, все три системы перезагружаются одновременно. Все три системы находятся в одной цепи.
Серверы и коммутаторы работают на устройстве ИБП, а система доступа к карте также имеет собственную резервную батарею, поэтому простая кратковременная потеря питания не объясняет этого, поскольку все должно просто продолжать работать от ИБП без перебоев. Мы отключили ИБП от стены и увидели, как серверы продолжают работать, как и ожидалось, поэтому ИБП, похоже, работает правильно в том, что касается перебоев в подаче электроэнергии.
Ни один из автоматических выключателей никогда не срабатывал и не нуждался в сбросе.
Система кондиционирования воздуха, по-видимому, подключена к отдельным серверам и сетевому оборудованию; тем не менее, его силовые кабели имеют общий канал с силовыми кабелями, которые идут к розеткам, используемым серверами и т. д. Может ли существовать риск наведения напряжения из одной цепи в другую при включении или выключении переменного тока, поскольку они параллельны друг к другу на несколько метров?
Я поговорил с одним из электриков, который пытался выяснить, что происходит, и он сказал, что, хотя блок кондиционирования воздуха находится в отдельной цепи от серверов и других систем, две цепи на самом деле имеют общую нейтраль - что, по его мнению, потенциально может вызвать проблемы. Это нормальная конфигурация или будет считаться плохой практикой иметь что-то вроде блока переменного тока, совместно использующего нейтраль с чувствительным оборудованием в серверной?
В настоящее время проблема исчезла сама собой. Серверы перестали самопроизвольно перезагружаться, и коммутаторы снова подключены к сети, но никаких реальных изменений не произошло, поэтому основная проблема все еще существует и, вероятно, рано или поздно появится снова.
Учитывая, что во время этих эпизодов мы наблюдаем перезагрузку нескольких систем с отдельными блоками резервного питания, какие возможные объяснения могут быть помимо скачков напряжения или скачков напряжения?
Хотя это не прямой ответ «вот вам проблема», на который вы надеялись, вот мое предложение.
Похоже, что, несмотря на благородство, ваше стремление выяснить, что не так, вы не решите быстро.
Вы можете поступать так, как предлагали другие, и пытаться регистрировать все, что вы можете, и надеяться, что появится шаблон.
Мне нравится предложение Дероберта нанять кого-нибудь для измерения качества электроэнергии ...
ОДНАКО, вот мое собственное предложение, которое вы уже сделали. Оставьте это электрикам.
Шутки в сторону. Квалифицированный электрик (даже если вам придется передать его на аутсорсинг) сможет объяснить вам первопричину ЕСЛИ это электрическая природа или нет. Они могут проверить каждую цепь, чтобы убедиться, что она не перегружена (особенно при скачках / запусках), они могут убедиться, что проводка соответствует требованиям, а размеры цепей соответствуют тому, что вы к ним подключаете. и т. д. и т. д.
В большинстве случаев у ИТ-отдела нет своего квалифицированного электрика, и мы часто просто «подключаем оборудование» и не понимаем, используем ли мы правильные схемы, схемы балансировки и т. Д.
Если ваш ИБП поддерживает сбор журналов, я бы это сделал, хотя бы для того, чтобы помочь доказать проблему. Хотя ваш ИБП может быть недостаточно высокого класса, чтобы должным образом (быстро) компенсировать скачки / спады, это не означает, что это основная причина. Для меня это звучит как проблема с электричеством. Если вы используете хороший онлайн-ИБП, и кажется, что он правильно компенсирует входное напряжение (на основе его журналов), то было бы странно, если бы все ИТ-оборудование, подключенное к нему, и система считывания карт перезагружались одновременно. .
Поговорите со своим начальником и объясните проблему с точки зрения того, что для диагностики требуется квалифицированный электрик. Несправедливо ожидать, что электрик настроит маршрутизацию BGP, и, наоборот, не следует ожидать, что системный администратор будет квалифицированным электриком.