Назад | Перейти на главную страницу

Ошибка аварийного дампа 0x80070057 - Windows Server 2003R2 SP2 BSOD, связанный с BackupExec

по состоянию на вчерашнюю ночь у нас пару раз был IBM Server, на котором запущен 2003R2 BSOD, и с тех пор я рылся в сети в поисках ответов. Я определил, что его запускает, и это задание BackupExec, которое выполнялось без ошибок столько, сколько я помню каждую ночь до прошлой ночи. Это главный файловый сервер, который имеет доступ к IBM Tape Unit для своих резервных копий. На файловом сервере не было внесено никаких фактических изменений - единственными изменениями были некоторые старые базы данных, которые были удалены и фактически находятся на другом сервере.

Причина, по которой я считаю, что это задание BackupExec, заключается в том, что это происходило у меня дважды, и оба раза это происходило примерно через 2 часа 30 минут после резервного копирования.

Я прикрепил файл минидампа, чтобы посмотреть, может ли кто-нибудь пролить свет на настоящую причину. Пока он не будет решен, я не смогу сделать резервную копию файловой системы на ленту. Минидамп выглядит следующим образом:

Microsoft (R) Windows Debugger Version 6.11.0001.404 AMD64
Copyright (c) Microsoft Corporation. All rights reserved.


Loading Dump File [C:\WINDOWS\Minidump\Mini111909-02.dmp]
Mini Kernel Dump File: Only registers and stack trace are available

Symbol search path is: symsrv*symsrv.dll*C:\WINDOWS\Symbols*http://msdl.microsoft.com/download/symbols
Executable search path is: 

"nt" was not found in the image list.
Debugger will attempt to load "nt" at given base 00000000`00000000.

Please provide the full image name, including the extension (i.e. kernel32.dll)
for more reliable results.Base address and size overrides can be given as
.reload <image.ext>=<base>,<size>.
Unable to load image nt, Win32 error 0n2
Unable to add module at 00000000`00000000
Debugger can not determine kernel base address
Windows Server 2003 Kernel Version 3790 (Service Pack 2) MP (8 procs) Free x64
Product: Server, suite: TerminalServer SingleUserTS
Machine Name:
Kernel base = 0xfffff800`01000000 PsLoadedModuleList = 0xfffff800`011d4140
Debug session time: Thu Nov 19 13:16:06.265 2009 (GMT+8)
System Uptime: 0 days 10:45:23.816

"nt" was not found in the image list.
Debugger will attempt to load "nt" at given base 00000000`00000000.

Please provide the full image name, including the extension (i.e. kernel32.dll)
for more reliable results.Base address and size overrides can be given as
.reload <image.ext>=<base>,<size>.
Unable to load image nt, Win32 error 0n2
Unable to add module at 00000000`00000000
Debugger can not determine kernel base address
Loading Kernel Symbols

Loading User Symbols
*******************************************************************************
*                                                                             *
*                        Bugcheck Analysis                                    *
*                                                                             *
*******************************************************************************

Use !analyze -v to get detailed debugging information.

BugCheck E0E7E, {ffffffffc0000005, fffffade93956726, fffffade95c6c450, fffffade95c6be60}

***** Debugger could not find nt in module list, module list might be corrupt, error 0x80070057.

Probably caused by : Unknown_Image ( ANALYSIS_INCONCLUSIVE )

Followup: MachineOwner
---------

0: kd> !analyze -v
*******************************************************************************
*                                                                             *
*                        Bugcheck Analysis                                    *
*                                                                             *
*******************************************************************************

Unknown bugcheck code (e0e7e)
Unknown bugcheck description
Arguments:
Arg1: ffffffffc0000005
Arg2: fffffade93956726
Arg3: fffffade95c6c450
Arg4: fffffade95c6be60

Debugging Details:
------------------

***** Debugger could not find nt in module list, module list might be corrupt, error 0x80070057.


CUSTOMER_CRASH_COUNT:  2

DEFAULT_BUCKET_ID:  DRIVER_FAULT_SERVER_MINIDUMP

BUGCHECK_STR:  0xE0E7E

CURRENT_IRQL:  0

LAST_CONTROL_TRANSFER:  from fffffade9bf68759 to fffffade9bf68b42

STACK_TEXT:  
fffff800`00074d68 fffffade`9bf68759 : fffff800`011b4940 fffffade`d3b54040 00000000`00000010 fffffade`d40fce60 : 0xfffffade`9bf68b42
fffff800`00074d70 fffff800`011b4940 : fffffade`d3b54040 00000000`00000010 fffffade`d40fce60 fffff800`011b2450 : 0xfffffade`9bf68759
fffff800`00074d78 fffffade`d3b54040 : 00000000`00000010 fffffade`d40fce60 fffff800`011b2450 fffff800`0103190c : 0xfffff800`011b4940
fffff800`00074d80 00000000`00000010 : fffffade`d40fce60 fffff800`011b2450 fffff800`0103190c fffff800`0006e000 : 0xfffffade`d3b54040
fffff800`00074d88 fffffade`d40fce60 : fffff800`011b2450 fffff800`0103190c fffff800`0006e000 fffff800`011b4901 : 0x10
fffff800`00074d90 fffff800`011b2450 : fffff800`0103190c fffff800`0006e000 fffff800`011b4901 fffff800`011b2450 : 0xfffffade`d40fce60
fffff800`00074d98 fffff800`0103190c : fffff800`0006e000 fffff800`011b4901 fffff800`011b2450 00000000`0005ffd4 : 0xfffff800`011b2450
fffff800`00074da0 fffff800`0006e000 : fffff800`011b4901 fffff800`011b2450 00000000`0005ffd4 00000000`0005ffd4 : 0xfffff800`0103190c
fffff800`00074da8 fffff800`011b4901 : fffff800`011b2450 00000000`0005ffd4 00000000`0005ffd4 fffff800`01067b5e : 0xfffff800`0006e000
fffff800`00074db0 fffff800`011b2450 : 00000000`0005ffd4 00000000`0005ffd4 fffff800`01067b5e fffff800`011b0180 : 0xfffff800`011b4901
fffff800`00074db8 00000000`0005ffd4 : 00000000`0005ffd4 fffff800`01067b5e fffff800`011b0180 fffff800`011b0180 : 0xfffff800`011b2450
fffff800`00074dc0 00000000`0005ffd4 : fffff800`01067b5e fffff800`011b0180 fffff800`011b0180 fffff800`011b4500 : 0x5ffd4
fffff800`00074dc8 fffff800`01067b5e : fffff800`011b0180 fffff800`011b0180 fffff800`011b4500 fffffade`d3b54040 : 0x5ffd4
fffff800`00074dd0 fffff800`011b0180 : fffff800`011b0180 fffff800`011b4500 fffffade`d3b54040 00000000`00000006 : 0xfffff800`01067b5e
fffff800`00074dd8 fffff800`011b0180 : fffff800`011b4500 fffffade`d3b54040 00000000`00000006 fffff800`014141d1 : 0xfffff800`011b0180
fffff800`00074de0 fffff800`011b4500 : fffffade`d3b54040 00000000`00000006 fffff800`014141d1 00000000`00000000 : 0xfffff800`011b0180
fffff800`00074de8 fffffade`d3b54040 : 00000000`00000006 fffff800`014141d1 00000000`00000000 00000000`00000000 : 0xfffff800`011b4500
fffff800`00074df0 00000000`00000006 : fffff800`014141d1 00000000`00000000 00000000`00000000 00000000`00000000 : 0xfffffade`d3b54040
fffff800`00074df8 fffff800`014141d1 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : 0x6
fffff800`00074e00 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : 0xfffff800`014141d1


STACK_COMMAND:  kb

SYMBOL_NAME:  ANALYSIS_INCONCLUSIVE

FOLLOWUP_NAME:  MachineOwner

MODULE_NAME: Unknown_Module

IMAGE_NAME:  Unknown_Image

DEBUG_FLR_IMAGE_TIMESTAMP:  0

BUCKET_ID:  CORRUPT_MODULELIST

Followup: MachineOwner
---------

0: kd> lmvm Unknown_Module
start             end                 module name

Приветствуются любые мысли!

Несколько месяцев назад у меня была точно такая же проблема, я пытался заменить SCSI-кабели, терминатор и scsi-карту (по одной). Ничего не получилось. Заменил все вместе, все прошло гладко.

Вероятно, это было короткое замыкание в карте scsi, из-за которого активный терминатор (и сама карта scsi) сгорели и умерли. Может, тебе стоит попробовать и это?

Какая версия Backup Exec у вас установлена. Есть ли на удаленных серверах агенты? Все ли пакеты обновления и исправления установлены?

это забавно. мы получили точную проблему со вчерашнего утра. сегодня второй синий экран. Я думаю, что смогу помочь найти решение.

мы используем два узла файлового кластера. первый получил синий экран во время резервного копирования вчера утром в 5:45. второй узел получил ресурсы кластера файлов, а первый был перезагружен.

сегодня утром в 3.45 перезагрузился второй из-за синего экрана.

использовали резервную копию exec 11d на sp3. ничего не изменилось, только конфиг dfsr в понедельник. патчей от Microsoft нет с октября 2009 г. без изменений на сервере бэкапа уже давно. оба сервера работают под управлением 2003 x64 ent r2 с sp2 на языке en (хотя работают в германии).

Я не могу найти никакой информации журнала, только код ошибки E0E7E.

тот факт, что у двух серверов одна и та же проблема, если они обслуживают файловый ресурс во время резервного копирования, то проблема должна быть первичной с резервным копированием.

мы также используем трендмикро офисскан. Никакой другой кластер / сервер не имеет проблем, только файловый кластер.

Я сейчас проверяю антивирус. Я не могу поверить, что существует проблема только с резервной копией. во время резервного копирования должно быть действие со вторым программным обеспечением / процессом.

Я проверил локальный клиент officecan и увидел, что папка отката была создана 18 ноября в 700 утра (GMT + 1). похоже, это обновление с драйвером брандмауэра / движка.

Я включаю отладку тренда, и мы увидим ...

что ты используешь? Матиас