по состоянию на вчерашнюю ночь у нас пару раз был IBM Server, на котором запущен 2003R2 BSOD, и с тех пор я рылся в сети в поисках ответов. Я определил, что его запускает, и это задание BackupExec, которое выполнялось без ошибок столько, сколько я помню каждую ночь до прошлой ночи. Это главный файловый сервер, который имеет доступ к IBM Tape Unit для своих резервных копий. На файловом сервере не было внесено никаких фактических изменений - единственными изменениями были некоторые старые базы данных, которые были удалены и фактически находятся на другом сервере.
Причина, по которой я считаю, что это задание BackupExec, заключается в том, что это происходило у меня дважды, и оба раза это происходило примерно через 2 часа 30 минут после резервного копирования.
Я прикрепил файл минидампа, чтобы посмотреть, может ли кто-нибудь пролить свет на настоящую причину. Пока он не будет решен, я не смогу сделать резервную копию файловой системы на ленту. Минидамп выглядит следующим образом:
Microsoft (R) Windows Debugger Version 6.11.0001.404 AMD64
Copyright (c) Microsoft Corporation. All rights reserved.
Loading Dump File [C:\WINDOWS\Minidump\Mini111909-02.dmp]
Mini Kernel Dump File: Only registers and stack trace are available
Symbol search path is: symsrv*symsrv.dll*C:\WINDOWS\Symbols*http://msdl.microsoft.com/download/symbols
Executable search path is:
"nt" was not found in the image list.
Debugger will attempt to load "nt" at given base 00000000`00000000.
Please provide the full image name, including the extension (i.e. kernel32.dll)
for more reliable results.Base address and size overrides can be given as
.reload <image.ext>=<base>,<size>.
Unable to load image nt, Win32 error 0n2
Unable to add module at 00000000`00000000
Debugger can not determine kernel base address
Windows Server 2003 Kernel Version 3790 (Service Pack 2) MP (8 procs) Free x64
Product: Server, suite: TerminalServer SingleUserTS
Machine Name:
Kernel base = 0xfffff800`01000000 PsLoadedModuleList = 0xfffff800`011d4140
Debug session time: Thu Nov 19 13:16:06.265 2009 (GMT+8)
System Uptime: 0 days 10:45:23.816
"nt" was not found in the image list.
Debugger will attempt to load "nt" at given base 00000000`00000000.
Please provide the full image name, including the extension (i.e. kernel32.dll)
for more reliable results.Base address and size overrides can be given as
.reload <image.ext>=<base>,<size>.
Unable to load image nt, Win32 error 0n2
Unable to add module at 00000000`00000000
Debugger can not determine kernel base address
Loading Kernel Symbols
Loading User Symbols
*******************************************************************************
* *
* Bugcheck Analysis *
* *
*******************************************************************************
Use !analyze -v to get detailed debugging information.
BugCheck E0E7E, {ffffffffc0000005, fffffade93956726, fffffade95c6c450, fffffade95c6be60}
***** Debugger could not find nt in module list, module list might be corrupt, error 0x80070057.
Probably caused by : Unknown_Image ( ANALYSIS_INCONCLUSIVE )
Followup: MachineOwner
---------
0: kd> !analyze -v
*******************************************************************************
* *
* Bugcheck Analysis *
* *
*******************************************************************************
Unknown bugcheck code (e0e7e)
Unknown bugcheck description
Arguments:
Arg1: ffffffffc0000005
Arg2: fffffade93956726
Arg3: fffffade95c6c450
Arg4: fffffade95c6be60
Debugging Details:
------------------
***** Debugger could not find nt in module list, module list might be corrupt, error 0x80070057.
CUSTOMER_CRASH_COUNT: 2
DEFAULT_BUCKET_ID: DRIVER_FAULT_SERVER_MINIDUMP
BUGCHECK_STR: 0xE0E7E
CURRENT_IRQL: 0
LAST_CONTROL_TRANSFER: from fffffade9bf68759 to fffffade9bf68b42
STACK_TEXT:
fffff800`00074d68 fffffade`9bf68759 : fffff800`011b4940 fffffade`d3b54040 00000000`00000010 fffffade`d40fce60 : 0xfffffade`9bf68b42
fffff800`00074d70 fffff800`011b4940 : fffffade`d3b54040 00000000`00000010 fffffade`d40fce60 fffff800`011b2450 : 0xfffffade`9bf68759
fffff800`00074d78 fffffade`d3b54040 : 00000000`00000010 fffffade`d40fce60 fffff800`011b2450 fffff800`0103190c : 0xfffff800`011b4940
fffff800`00074d80 00000000`00000010 : fffffade`d40fce60 fffff800`011b2450 fffff800`0103190c fffff800`0006e000 : 0xfffffade`d3b54040
fffff800`00074d88 fffffade`d40fce60 : fffff800`011b2450 fffff800`0103190c fffff800`0006e000 fffff800`011b4901 : 0x10
fffff800`00074d90 fffff800`011b2450 : fffff800`0103190c fffff800`0006e000 fffff800`011b4901 fffff800`011b2450 : 0xfffffade`d40fce60
fffff800`00074d98 fffff800`0103190c : fffff800`0006e000 fffff800`011b4901 fffff800`011b2450 00000000`0005ffd4 : 0xfffff800`011b2450
fffff800`00074da0 fffff800`0006e000 : fffff800`011b4901 fffff800`011b2450 00000000`0005ffd4 00000000`0005ffd4 : 0xfffff800`0103190c
fffff800`00074da8 fffff800`011b4901 : fffff800`011b2450 00000000`0005ffd4 00000000`0005ffd4 fffff800`01067b5e : 0xfffff800`0006e000
fffff800`00074db0 fffff800`011b2450 : 00000000`0005ffd4 00000000`0005ffd4 fffff800`01067b5e fffff800`011b0180 : 0xfffff800`011b4901
fffff800`00074db8 00000000`0005ffd4 : 00000000`0005ffd4 fffff800`01067b5e fffff800`011b0180 fffff800`011b0180 : 0xfffff800`011b2450
fffff800`00074dc0 00000000`0005ffd4 : fffff800`01067b5e fffff800`011b0180 fffff800`011b0180 fffff800`011b4500 : 0x5ffd4
fffff800`00074dc8 fffff800`01067b5e : fffff800`011b0180 fffff800`011b0180 fffff800`011b4500 fffffade`d3b54040 : 0x5ffd4
fffff800`00074dd0 fffff800`011b0180 : fffff800`011b0180 fffff800`011b4500 fffffade`d3b54040 00000000`00000006 : 0xfffff800`01067b5e
fffff800`00074dd8 fffff800`011b0180 : fffff800`011b4500 fffffade`d3b54040 00000000`00000006 fffff800`014141d1 : 0xfffff800`011b0180
fffff800`00074de0 fffff800`011b4500 : fffffade`d3b54040 00000000`00000006 fffff800`014141d1 00000000`00000000 : 0xfffff800`011b0180
fffff800`00074de8 fffffade`d3b54040 : 00000000`00000006 fffff800`014141d1 00000000`00000000 00000000`00000000 : 0xfffff800`011b4500
fffff800`00074df0 00000000`00000006 : fffff800`014141d1 00000000`00000000 00000000`00000000 00000000`00000000 : 0xfffffade`d3b54040
fffff800`00074df8 fffff800`014141d1 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : 0x6
fffff800`00074e00 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : 0xfffff800`014141d1
STACK_COMMAND: kb
SYMBOL_NAME: ANALYSIS_INCONCLUSIVE
FOLLOWUP_NAME: MachineOwner
MODULE_NAME: Unknown_Module
IMAGE_NAME: Unknown_Image
DEBUG_FLR_IMAGE_TIMESTAMP: 0
BUCKET_ID: CORRUPT_MODULELIST
Followup: MachineOwner
---------
0: kd> lmvm Unknown_Module
start end module name
Приветствуются любые мысли!
Несколько месяцев назад у меня была точно такая же проблема, я пытался заменить SCSI-кабели, терминатор и scsi-карту (по одной). Ничего не получилось. Заменил все вместе, все прошло гладко.
Вероятно, это было короткое замыкание в карте scsi, из-за которого активный терминатор (и сама карта scsi) сгорели и умерли. Может, тебе стоит попробовать и это?
Какая версия Backup Exec у вас установлена. Есть ли на удаленных серверах агенты? Все ли пакеты обновления и исправления установлены?
это забавно. мы получили точную проблему со вчерашнего утра. сегодня второй синий экран. Я думаю, что смогу помочь найти решение.
мы используем два узла файлового кластера. первый получил синий экран во время резервного копирования вчера утром в 5:45. второй узел получил ресурсы кластера файлов, а первый был перезагружен.
сегодня утром в 3.45 перезагрузился второй из-за синего экрана.
использовали резервную копию exec 11d на sp3. ничего не изменилось, только конфиг dfsr в понедельник. патчей от Microsoft нет с октября 2009 г. без изменений на сервере бэкапа уже давно. оба сервера работают под управлением 2003 x64 ent r2 с sp2 на языке en (хотя работают в германии).
Я не могу найти никакой информации журнала, только код ошибки E0E7E.
тот факт, что у двух серверов одна и та же проблема, если они обслуживают файловый ресурс во время резервного копирования, то проблема должна быть первичной с резервным копированием.
мы также используем трендмикро офисскан. Никакой другой кластер / сервер не имеет проблем, только файловый кластер.
Я сейчас проверяю антивирус. Я не могу поверить, что существует проблема только с резервной копией. во время резервного копирования должно быть действие со вторым программным обеспечением / процессом.
Я проверил локальный клиент officecan и увидел, что папка отката была создана 18 ноября в 700 утра (GMT + 1). похоже, это обновление с драйвером брандмауэра / движка.
Я включаю отладку тренда, и мы увидим ...
что ты используешь? Матиас