Назад | Перейти на главную страницу

HP ProLiant DL380 G3 под управлением Windows Server 2000 дает сбой между 6-7:30 утра в течение последних 5 дней.

У меня есть HP ProLiant DL380 G3 под управлением Windows Server 2000, который каждый день дает сбой между 6-730 утра. Это началось, когда я заменил неисправный жесткий диск 6 дней назад. Я просмотрел запланированные задачи, которые не имеют отношения к этой проблеме. Ниже приведены единственное, что я вижу в системном журнале и некоторых файлах дампа. Может ли это быть аппаратной проблемой, если это происходит каждый день в определенное время? Любая помощь приветствуется. Спасибо

Предыдущее завершение работы системы в 6:07:55 7 февраля 2012 г. было неожиданным.

Агент системной информации: работоспособность: сервер снова в рабочем состоянии. Сервер был ранее выключен функцией автоматического восстановления сервера (ASR) и только что снова стал работать. [ЛОВУШКА SNMP: 6025 в CPQHLTH.MIB]

BugCheck 7A, {3, c0000005, 3400028, 0}

Вероятно, вызвано: memory_corruption (nt! MiMakeSystemAddressValidPfn + 42)

Продолжение: MachineOwner

0: kd>! Анализировать -v


KERNEL_DATA_INPAGE_ERROR (7a) Запрошенная страница данных ядра не может быть прочитана. Обычно это вызвано плохим блоком в файле подкачки или ошибкой контроллера диска. Также см. KERNEL_STACK_INPAGE_ERROR. Если статус ошибки - 0xC000000E, 0xC000009C, 0xC000009D или 0xC0000185, это означает, что в дисковой подсистеме произошел сбой. Если статус ошибки - 0xC000009A, то это означает, что запрос не удался, потому что файловая система не смогла продвинуться вперед. Аргументы: Arg1: 00000003, тип удерживаемой блокировки (значение 1,2,3 или адрес PTE) Arg2: c0000005, состояние ошибки (обычно код состояния ввода-вывода) Arg3: 03400028, текущий процесс (виртуальный адрес для типа блокировки 3 , или PTE) Arg4: 00000000, виртуальный адрес, который не может быть загружен в подкачку (или содержимое PTE, если arg1 является адресом PTE)

MODULE_NAME: nt

IMAGE_NAME: memory_corruption


BugCheck A, {0, 2, 1, 804137d6}

Вероятно, вызвано: ntkrnlmp.exe (nt! CcGetVirtualAddress + ba)


IRQL_NOT_LESS_OR_EQUAL (a) Была сделана попытка доступа к страничному (или полностью недопустимому) адресу на слишком высоком уровне запроса прерывания (IRQL). Обычно это вызвано тем, что драйверы используют неправильные адреса. Если доступен отладчик ядра, получите трассировку стека. Аргументы: Arg1: 00000000, ссылка на память Arg2: 00000002, IRQL Arg3: 00000001, битовое поле: бит 0: значение 0 = операция чтения, 1 = операция записи, бит 3: значение 0 = не операция выполнения, 1 = операция выполнения (только на чипы, которые поддерживают этот уровень статуса) Arg4: 804137d6, адрес которого ссылается на память

MODULE_NAME: nt

IMAGE_NAME: ntkrnlmp.exe

Первое, что нужно понять, это то, что Windows 2000 больше не поддерживается Microsoft. Новые уязвимости безопасности больше не исправляются. Обновление Windows на этом сервере теперь бессмысленно. Уже одно это означает, что давно пора уходить с этого сервера.

Второе, что следует учитывать, - это то, что, учитывая согласованное время, вы можете просмотреть любые запланированные задачи в системе, которые активны в этот период. Также обратите внимание на другие факторы окружающей среды - действительно, все, что увеличивает нагрузку на сервер в определенное время суток, может подтолкнуть оборудование, которое только начинает выходить из строя.

Это приводит к следующему: учитывая возраст оборудования, очень вероятно, что это просто что-то вроде старой карты RAM, которая вышла из строя, тем более, что одна из ваших ошибок - повреждение памяти. Но опять же, это действительно указывает мне на то, что этот сервер подошел к концу и его следует заменить, потому что даже если вы обнаружите и исправите эту проблему, у вас, скорее всего, довольно скоро появится еще один.

Пора обновляться. Смотри мой комментарии здесь в следующем вопросе: HP DL380 G3 2U для базового веб-сервера в 2012 г. и Лучший сисадмин WTF?

Поскольку вы работаете с оборудованием 9-летней давности, существует обычный риск выхода из строя компонентов. Однако эта конкретная проблема может быть связана с прошивкой. Пожалуйста, убедитесь, что вы бегаете больше всего последняя прошивка для Windows 2000 + DL380 G3. Обратите особое внимание на версия системы BIOS и Контроллер Smart Array (5i? 5300? 641? 6400?). Посмотрим, имеет ли это значение на данный момент.