У нас есть Windows 2003 Server, который дает сбой относительно регулярно (примерно раз в неделю). В момент сбоя сервера в журналах событий нет никакой информации. Ни в приложении, ни в безопасности, ни в системе. Система мониторинга (Nagios) не сообщает о каких-либо ненормальных условиях на машине во время сбоя. И когда я говорю «сбой», я имею в виду, что сервер выключается, а не просто синий экран.
Я сделал некоторые предположения о причине сбоев, но пока ничего не подтвердилось. Кто-нибудь знает, где я могу найти дополнительную информацию (например, журналы) или предоставить какие-либо полезные предположения относительно причины?
Как обстоят дела с питанием в том месте, где расположен сервер?
На бывшей стройплощадке здание будет регулярно проверять резервные генераторы, что может привести к отключению питания систем, если они не подключены к работающему ИБП. Конечно, руководство здания всем говорило, что это стандартная политика.
Есть ли закономерность при сбое серверов? Или случайным образом в течение недели?
Я также сталкивался с сайтами, где сами линии электропередач в серверный шкаф были плохими, из-за чего устройства ИБП срабатывали каждые несколько минут из-за падений или скачков напряжения.
Если синего экрана нет, операционная система не контролировала ситуацию, когда сервер вышел из строя. Я думаю, это означает, что вы тоже не найдете никаких журналов. Для меня это звучит как проблема с оборудованием, возможно, связана с нагревом или питанием?