locked
window2003_R2_x64_SP2 系统蓝屏,debug结果如下,请帮忙分析!! RRS feed

  • 问题

  • window2003 R2 X64 SP2_CN系统,现在过十几天就会蓝屏一次,蓝屏后自动重启可以正常进入系统。经过debug minidump提示ntoskrnl.exe、mssmbios.sys引起的,不知道是什么原因该如何修复?请大家帮忙分析一下,谢谢!!

    ****************************************************************************

    Microsoft (R) Windows Debugger Version 6.2.9200.16384 AMD64
    Copyright (c) Microsoft Corporation. All rights reserved.

    Loading Dump File [E:\3、winning\2013\hbey2013.2.23\Minidump_B\Mini021813-01.dmp]
    Mini Kernel Dump File: Only registers and stack trace are available

    Symbol search path is: C:\Windows\Symbols
    Executable search path is:
    Unable to load image ntoskrnl.exe, Win32 error 0n2
    *** WARNING: Unable to verify timestamp for ntoskrnl.exe
    Windows Server 2003 Kernel Version 3790 (Service Pack 2) MP (64 procs) Free x64
    Product: Server, suite: Enterprise TerminalServer SingleUserTS
    Machine Name:
    Kernel base = 0xfffff800`01000000 PsLoadedModuleList = 0xfffff800`011d8280
    Debug session time: Mon Feb 18 18:05:09.343 2013 (UTC + 8:00)
    System Uptime: 17 days 8:37:03.286
    Unable to load image ntoskrnl.exe, Win32 error 0n2
    *** WARNING: Unable to verify timestamp for ntoskrnl.exe
    Loading Kernel Symbols
    ...............................................................
    ....................................................
    Loading User Symbols
    Loading unloaded module list
    ............
    *******************************************************************************
    *                                                                             *
    *                        Bugcheck Analysis                                    *
    *                                                                             *
    *******************************************************************************

    Use !analyze -v to get detailed debugging information.

    BugCheck C5, {fffffade05f5e100, 2, 0, fffff800011addf4}

    *** WARNING: Unable to verify timestamp for mssmbios.sys
    Probably caused by : ntoskrnl.exe ( nt!`string'+e4 )

    Followup: MachineOwner
    ---------
    31: kd> !analyze -v
    *******************************************************************************
    *                                                                             *
    *                        Bugcheck Analysis                                    *
    *                                                                             *
    *******************************************************************************

    DRIVER_CORRUPTED_EXPOOL (c5)
    An attempt was made to access a pageable (or completely invalid) address at an
    interrupt request level (IRQL) that is too high.  This is
    caused by drivers that have corrupted the system pool.  Run the driver
    verifier against any new (or suspect) drivers, and if that doesn't turn up
    the culprit, then use gflags to enable special pool.
    Arguments:
    Arg1: fffffade05f5e100, memory referenced
    Arg2: 0000000000000002, IRQL
    Arg3: 0000000000000000, value 0 = read operation, 1 = write operation
    Arg4: fffff800011addf4, address which referenced memory

    Debugging Details:
    ------------------


    BUGCHECK_STR:  0xC5_2

    CURRENT_IRQL:  2

    FAULTING_IP:
    nt!`string'+e4
    fffff800`011addf4 4d8b10          mov     r10,qword ptr [r8]

    CUSTOMER_CRASH_COUNT:  1

    DEFAULT_BUCKET_ID:  DRIVER_FAULT

    PROCESS_NAME:  System

    LAST_CONTROL_TRANSFER:  from fffff8000102e874 to fffff8000102eb50

    STACK_TEXT:  
    fffffacc`80651498 fffff800`0102e874 : 00000000`0000000a fffffade`05f5e100 00000000`00000002 00000000`00000000 : nt!FsRtlPrivateCheckWaitingLocks+0x310
    fffffacc`806514a0 00000000`0000000a : fffffade`05f5e100 00000000`00000002 00000000`00000000 fffff800`011addf4 : nt!FsRtlPrivateCheckWaitingLocks+0x34
    fffffacc`806514a8 fffffade`05f5e100 : 00000000`00000002 00000000`00000000 fffff800`011addf4 fffffadf`cbebe240 : 0xa
    fffffacc`806514b0 00000000`00000002 : 00000000`00000000 fffff800`011addf4 fffffadf`cbebe240 00000000`00000000 : 0xfffffade`05f5e100
    fffffacc`806514b8 00000000`00000000 : fffff800`011addf4 fffffadf`cbebe240 00000000`00000000 00000000`00000000 : 0x2


    STACK_COMMAND:  .bugcheck ; kb

    FOLLOWUP_IP:
    nt!`string'+e4
    fffff800`011addf4 4d8b10          mov     r10,qword ptr [r8]

    SYMBOL_NAME:  nt!`string'+e4

    FOLLOWUP_NAME:  MachineOwner

    MODULE_NAME: nt

    IMAGE_NAME:  ntoskrnl.exe

    DEBUG_FLR_IMAGE_TIMESTAMP:  4a798b42

    FAILURE_BUCKET_ID: X64_0xC5_2_nt!_string_+e4

    BUCKET_ID:  X64_0xC5_2_nt!_string_+e4

    Followup: MachineOwner
    ---------
    • 已移动 Min Zhu 2013年2月26日 8:20
    • 已移动 Alexis ZhangMVP 2013年2月27日 1:16 与主题更相符。
    2013年2月23日 14:38

答案

  • 谢谢Alexis Zhang 的关注!

    因为服务器下连接了两台IBM v7000存储,系统日志里又有许多关于IO的报错信息,怀疑是HBA卡驱动或多路径软件的问题,后来重新安装HBA卡驱动,故障还存在。

    两台服务器安装的多路径软件、OS版本相同,另外一台没有出现过类似问题,就没有重新安装多路径软件。

    由于是业务系统,为了避免再次重启,我已经把有问题的服务器重新安装了OS,安装完成后到目前为止运行正常。


    2013年3月16日 7:55

全部回复

  • 你好。由于这是一个 NT 5 系统(Windows Server 2003 R2)的蓝屏问题,而且与服务器设置关系不大,所以将其移动至本组讨论。谢谢合作。
     
    --
    Alexis Zhang
     
    http://mvp.support.microsoft.com/profile/jie
    http://blogs.itecn.net/blogs/alexis
     
    推荐以 NNTP Bridge 桥接新闻组方式访问论坛以获取最佳用户体验。
     
    本帖是回复帖,原帖作者是楼上的 "随.风"
     
    window2003 R2 X64 SP2_CN系统,现在过十几天就会蓝屏一次,蓝屏后自动重启可以正常进入系统。经过debug minidump提示ntoskrnl.exe、mssmbios.sys引起的,不知道是什么原因该如何修复?请大家帮忙分析一下,谢谢
     
    2013年2月27日 1:44
  • 根据故障代码及 Dump 文件信息,这个蓝屏应该是硬件或驱动程序故障引起 Windows Kernel 系统文件运行失败。
     
    这个蓝屏是否在长时间运行一段时间之后(十几天)出现一次?在短时间内是否会出现?如果是前者的话建议检查一下服务器稳定性,是否在长时间运行后因为散热等问题无法持续工作;如果是后者则可能原因较多,需要更多的文件及故障出现规律分析准确原因。
     
    --
    Alexis Zhang
     
    http://mvp.support.microsoft.com/profile/jie
    http://blogs.itecn.net/blogs/alexis
     
    推荐以 NNTP Bridge 桥接新闻组方式访问论坛以获取最佳用户体验。
     
    本帖是回复帖,原帖作者是楼上的 "随.风"
     
    BugCheck C5, {fffffade05f5e100, 2, 0, fffff800011addf4}
    *** WARNING: Unable to verify timestamp for mssmbios.sys
     
     
    2013年2月27日 2:08
  • 请问这个问题有何进展吗?如果有更多的故障规律或更多的 Dump 文件请继续回复提供。
     
    --
    Alexis Zhang
     
    http://mvp.support.microsoft.com/profile/jie
    http://blogs.itecn.net/blogs/alexis
     
    推荐以 NNTP Bridge 桥接新闻组方式访问论坛以获取最佳用户体验。
     
    本帖是回复帖,原帖作者是楼上的 "Alexis Zhang"
     
    根据故障代码及 Dump 文件信息,这个蓝屏应该是硬件或驱动程序故障引起 Windows Kernel 系统文件运行失败。
    这个蓝屏是否在长时间运行一段时间之后(十几天)出现一次?在短时间内是否会出现?
     
     
    2013年3月3日 1:14
  • 谢谢Alexis Zhang 的关注!

    因为服务器下连接了两台IBM v7000存储,系统日志里又有许多关于IO的报错信息,怀疑是HBA卡驱动或多路径软件的问题,后来重新安装HBA卡驱动,故障还存在。

    两台服务器安装的多路径软件、OS版本相同,另外一台没有出现过类似问题,就没有重新安装多路径软件。

    由于是业务系统,为了避免再次重启,我已经把有问题的服务器重新安装了OS,安装完成后到目前为止运行正常。


    2013年3月16日 7:55
  • 如果重新安装操作系统后故障可以消失,那应该不是什么严重问题。建议再观察一下,如果长时间运行后还会偶尔蓝屏,再提供新的 Dump 文件分析。
     
    --
    Alexis Zhang
     
    http://mvp.support.microsoft.com/profile/jie
    http://blogs.itecn.net/blogs/alexis
     
    推荐以 NNTP Bridge 桥接新闻组方式访问论坛以获取最佳用户体验。
     
    本帖是回复帖,原帖作者是楼上的 "随.风"
     
    两台服务器安装的多路径软件、OS版本相同,另外一台没有出现过类似问题,就没有重新安装多路径软件。
    由于是业务系统,为了避免再次重启,我已经把有问题的服务器重新安装了OS,安装完成后到目前为止运行正常。
     
     
    2013年3月17日 3:26