none
Ошибки STOP RRS feed

  • Вопрос

  • Доброго времени суток!

    Имеет место NLB-кластер из 3 узлов Supermicro под управлением Windows Server 2003 R2 x64 (SP2). Функционал - Exchange 2007, сервер терминалов, MS SQL 2005. Все три узла периодически выпадают в перезагрузку с синим экраном и ошибками:

    код 6008: Предыдущее завершение работы системы в 15:13:11 на 20.07.2009 было неожиданным.

    код 1001: Компьютер был перезагружен после критической ошибки: 0x0000001e (0xffffffffc0000005, 0xfffff800012c121f, 0x0000000000000000, 0xffffffffffffffff). Копия памяти сохранена: C:\WINDOWS\MEMORY.DMP.

    Отказ системы: Ошибка STOP
     Код причины: 0x805000f
     Код ошибки: 
     Строка проверки: 0x0000001e (0xffffffffc0000005, 0xfffff800012c121f, 0x0000000000000000, 0xffffffffffffffff)
     Комментарий: 0x0000001e (0xffffffffc0000005, 0xfffff800012c121f, 0x0000000000000000, 0xffffffffffffffff)

    Натыкался на статью об ошибках драйвера ntfs, слил HotFix, установил - как видно толку чуть... буду очень признателен, если кто-нить подскажет в каком направлении копать :-)
    20 июля 2009 г. 14:11

Ответы

Все ответы

  • копайте в направлении интерпритации Dump файлов

    http://social.technet.microsoft.com/Forums/ru-RU/xpru/thread/ba23fe6d-550c-4c7f-8141-d0d7974b778b

    после того как рсшифруете, выложите сюда, будем искать решение.


    сила в справедливости
    20 июля 2009 г. 14:58
  • В dmp-файлах запись об ошибке ntkrnlmp.exe и упоминание, видимо, одной из служб Exchange:

    Probably caused by : ntoskrnl.exe ( nt+2c121f )

    Crash date: Thu Jul 30 11:15:24.837 2009 (GMT+4)
    Stop error code:  0x1E
    Process name:  Microsoft.Excha
    Probably caused by: ntkrnlmp.exe ( ntPspGetSetContextInternal+203 )

    kd.exe выдает следующее:

    Microsoft (R) Windows Debugger Version 6.11.0001.404 AMD64
    Copyright (c) Microsoft Corporation. All rights reserved.

    Loading Dump File [Q:\minidump\Mini073009-01.dmp]
    Mini Kernel Dump File: Only registers and stack trace are available

    Symbol search path is: C:\symbols
    Executable search path is: C:\symbols
    Windows Server 2003 Kernel Version 3790 (Service Pack 2) MP (8 procs) Free x64
    Product: Server, suite: Enterprise TerminalServer
    Built by: 3790.srv03_sp2_gdr.090319-1204
    Machine Name:
    Kernel base = 0xfffff800`01000000 PsLoadedModuleList = 0xfffff800`011d4140
    Debug session time: Thu Jul 30 11:15:24.837 2009 (GMT+4)
    System Uptime: 0 days 16:22:15.402
    Loading Kernel Symbols
    ...............................................................
    ................................................
    Loading User Symbols
    Loading unloaded module list
    ..
    *******************************************************************************
    *                                                                             *
    *                        Bugcheck Analysis                                    *
    *                                                                             *
    *******************************************************************************

    Use !analyze -v to get detailed debugging information.

    BugCheck 1E, {ffffffffc0000005, fffff800012c121f, 0, 1ba8000}

    Probably caused by : ntkrnlmp.exe ( nt!PspGetSetContextInternal+203 )

    Followup: MachineOwner
    • Изменено a-voland 30 июля 2009 г. 9:27
    30 июля 2009 г. 8:50
  • а при анализе (!analyze -v ) вывод такой:
    KMODE_EXCEPTION_NOT_HANDLED (1e)
    This is a very common bugcheck.  Usually the exception address pinpoints
    the driver/function that caused the problem.  Always note this address
    as well as the link date of the driver/image that contains this address.
    Arguments:
    Arg1: ffffffffc0000005, The exception code that was not handled
    Arg2: fffff800012c121f, The address that the exception occurred at
    Arg3: 0000000000000000, Parameter 0 of the exception
    Arg4: 0000000001ba8000, Parameter 1 of the exception

    Debugging Details:
    ------------------


    EXCEPTION_CODE: (NTSTATUS) 0xc0000005 - <Unable to get error code text>

    FAULTING_IP:
    nt!PspGetSetContextInternal+203
    fffff800`012c121f 488b58f8        mov     rbx,qword ptr [rax-8]

    EXCEPTION_PARAMETER1:  0000000000000000

    EXCEPTION_PARAMETER2:  0000000001ba8000

    READ_ADDRESS:  0000000001ba8000

    CUSTOMER_CRASH_COUNT:  1

    DEFAULT_BUCKET_ID:  DRIVER_FAULT_SERVER_MINIDUMP

    BUGCHECK_STR:  0x1E

    PROCESS_NAME:  Microsoft.Excha

    CURRENT_IRQL:  1

    EXCEPTION_RECORD:  fffffadcb8f3db90 -- (.exr 0xfffffadcb8f3db90)
    ExceptionAddress: fffff800012c121f (nt!PspGetSetContextInternal+0x0000000000000203)
       ExceptionCode: c0000005 (Access violation)
      ExceptionFlags: 00000008
    NumberParameters: 2
       Parameter[0]: 0000000000000000
       Parameter[1]: 0000000001ba8000
    Attempt to read from address 0000000001ba8000

    TRAP_FRAME:  fffffadcb8f3dc20 -- (.trap 0xfffffadcb8f3dc20)
    NOTE: The trap frame does not contain all registers.
    Some register values may be zeroed or incorrect.
    rax=0000000001ba8008 rbx=0000000000000000 rcx=0000000000000001
    rdx=0000000000000000 rsi=0000000000000000 rdi=0000000000000000
    rip=fffff800012c121f rsp=fffffadcb8f3ddb0 rbp=fffffadcb8f53b10
     r8=0000000000000000  r9=0000000000000000 r10=0000000000000000
    r11=0000000000000000 r12=0000000000000000 r13=0000000000000000
    r14=0000000000000000 r15=0000000000000000
    iopl=0         nv up ei pl nz na pe nc
    nt!PspGetSetContextInternal+0x203:
    fffff800`012c121f 488b58f8        mov     rbx,qword ptr [rax-8] ds:0010:00000000`01ba8000=????????????????
    Resetting default scope

    LAST_CONTROL_TRANSFER:  from fffff80001080e86 to fffff8000102e890

    STACK_TEXT:
    fffffadc`b8f3d498 fffff800`01080e86 : 00000000`0000001e ffffffff`c0000005 fffff800`012c121f 00000000`00000000 : nt!KeBug
    CheckEx
    fffffadc`b8f3d4a0 fffff800`0102e6af : fffffadc`b8f3db90 fffff980`05100698 fffffadc`b8f3dc20 fffffadc`de3c81c8 : nt!KiDis
    patchException+0x128
    fffffadc`b8f3daa0 fffff800`0102d521 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiExc
    eptionExit
    fffffadc`b8f3dc20 fffff800`012c121f : fffffa80`005e7088 00000000`00000000 fffffadc`b8f3ec70 fffffadc`b8f535c0 : nt!KiPag
    eFault+0x1e1
    fffffadc`b8f3ddb0 fffff800`0104236b : fffffadc`dbaf6bf0 00000000`00000000 fffffadc`dbaf6c38 00000000`00000000 : nt!PspGe
    tSetContextInternal+0x203
    fffffadc`b8f3e300 fffff800`01027eb1 : fffffadc`de920000 fffffadc`0000000c fffffadc`de920060 00000000`000003b0 : nt!PspGe
    tSetContextSpecialApc+0xab
    fffffadc`b8f3e410 fffff800`0103bf97 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiDel
    iverApc+0x215
    fffffadc`b8f3e4b0 fffff800`0102828e : 00000000`00000000 00000000`00000000 fffffadc`dbaf6c88 fffffadc`dbaf6bf0 : nt!KiSwa
    pThread+0x3e9
    fffffadc`b8f3e510 fffff800`0101f88c : 00000000`00000000 00000000`00000005 00000000`00000000 fffffadc`def70e00 : nt!KeWai
    tForSingleObject+0x5a6
    fffffadc`b8f3e590 fffff800`0101f51b : fffffadc`b8f3e8c0 00000000`00000000 fffffadc`de920070 00000000`00000000 : nt!KiSus
    pendThread+0x2c
    fffffadc`b8f3e5d0 fffff800`01027abd : ffffffff`80000718 00000000`00000000 fffff800`0101f860 fffffadc`dabed000 : nt!KiDel
    iverApc+0x2d3
    fffffadc`b8f3e670 fffff800`011a4a66 : fffffadc`daf80240 00000000`00000000 00000000`00000001 fffffadc`b8f3e861 : nt!KiApc
    Interrupt+0xdd
    fffffadc`b8f3e800 fffff800`011a99d1 : fffffadc`dabed000 00000000`44536d45 fffff800`011ce1c0 00000000`05da6490 : nt!MiFre
    ePoolPages+0xfa1
    fffffadc`b8f3e890 fffffadc`dc5feea4 : 00000000`00000000 fffffadc`daf80270 fffffa80`00f17878 fffffa80`00f17860 : nt!ExFre
    ePoolWithTag+0x3a3
    fffffadc`b8f3e950 00000000`00000000 : fffffadc`daf80270 fffffa80`00f17878 fffffa80`00f17860 fffffadc`dae056a0 : 0xfffffa
    dc`dc5feea4


    STACK_COMMAND:  kb

    FOLLOWUP_IP:
    nt!PspGetSetContextInternal+203
    fffff800`012c121f 488b58f8        mov     rbx,qword ptr [rax-8]

    SYMBOL_STACK_INDEX:  4

    SYMBOL_NAME:  nt!PspGetSetContextInternal+203

    FOLLOWUP_NAME:  MachineOwner

    MODULE_NAME: nt

    IMAGE_NAME:  ntkrnlmp.exe

    DEBUG_FLR_IMAGE_TIMESTAMP:  49c237fa

    FAILURE_BUCKET_ID:  X64_0x1E_nt!PspGetSetContextInternal+203

    BUCKET_ID:  X64_0x1E_nt!PspGetSetContextInternal+203

    Followup: MachineOwner
    ---------
    30 июля 2009 г. 8:51
  • З.Ы. Непонятная и очень напрягающая ситуация, буду очень признателен, если Вы поможете разобраться... пока приходит в голову лишь сделать откат этих апдейтов...
    30 июля 2009 г. 9:07
  • - проверьте оперативную память тестами

    - вот тут подобная проблема с решением: http://social.microsoft.com/forums/zh-CN/windowsxpzhchs/thread/2e28939a-9bb4-4069-940b-d5cdfd9e8c50/  
    к сожалению на Китайском. В том случаем проблема была связанн с Антивирусом Касперского, конкретнее сказать не могу, простите мой Китайский :-)

    - делали ли какие нибудь изменения в конфигурации железа? изменения в биосе?

    - поставьте апдэйты на сервер (не забудьте сделать бэкап перед операцией)

    - попробуйте так же обновить драйвера для материнской платы (чипсет, контроллеры, etc) и сетевой карты.


    сила в справедливости
    30 июля 2009 г. 9:42
  • Нет, изменений в конфигурации не было, БИОС тоже не трогали... Каспера на узлах нет, стоит NOD... драйвера, конечно, обновлю, но тут что-то другое явно, на всех 3 узлах одна и та же ошибка и упоминание об Exchange...
    30 июля 2009 г. 10:06
  • какие одинаковые приложения стоят на 3 серверах?
    есть ли возможность удалить NOD и посмотреть исчезнет ли ошибка?


    сила в справедливости
    30 июля 2009 г. 11:30
  • NOD на одном из узлов удалил, посмотрим...
    А софт стоит на всех трех одинаковый... базовый набор офисного софта, NOD, Exchange, MS SQL... пожалуй, все...

    Возможно, проблема именно в НОДе?
    З.Ы. В течение практически 2 месяцев проблем не было, а НОД поставили за 5 дней до возникновения проблем...
    30 июля 2009 г. 12:32
  • похоже что проблема в NOD, погоняйте сервер с удаленным NOD, посмотрим как себя будет вести.

    сила в справедливости
    • Предложено в качестве ответа Kudrat Sapaev 28 января 2010 г. 20:08
    • Помечено в качестве ответа Vinokurov YuriyModerator 29 января 2010 г. 5:39
    30 июля 2009 г. 12:35
  • Обязательно отпишитесь о проблеме.
    Поможем друг другу стать лучше! Отметим правильные ответы и полезные сообщения!
    31 июля 2009 г. 12:54
    Модератор
  • Обязательно отпишитесь о проблеме.
    Поможем друг другу стать лучше! Отметим правильные ответы и полезные сообщения!

    Тоже на это очень надеюсь. У самого полностью идентичная проблема. NOD также установлен и ошибка такая же.
    14 августа 2009 г. 7:18
  • Если NOD удалить, ошибка остается?
    Все вышесказанное является моим личным мнением, не имеющим отношения к корпорации Майкрософт
    14 августа 2009 г. 10:56
    Модератор
  • Обязательно отпишитесь о проблеме.
    Поможем друг другу стать лучше! Отметим правильные ответы и полезные сообщения!

    Тоже на это очень надеюсь. У самого полностью идентичная проблема. NOD также установлен и ошибка такая же.

    Такая же проблема, как и у топикстартера. стоит 4 нод, exchange 2007 windows 2003 x64, железо supermicro.
    22 декабря 2009 г. 12:37
  • A1exey , а Вы пробовали Нод выключать?

    Поможем друг другу стать лучше! Отметим правильные ответы и полезные сообщения!
    23 декабря 2009 г. 7:15
    Модератор
  • Прошел месяц а никто не сообщил о результатах сноса нода... (

    Тоже Windows Server 2003 R2 x64 (SP2) и тоже NOD v.4.0.467.0 на 2-х серверах... При подключении через удаленный рабочий стол один перезагружается в 1 из 5 раз примерно (этот файловый сервер и маршрутизатор всего-лишь), другой в 1 из 50 (это файловый и VPN сервер)... Я в общем-то кроме как через RD не логинюсь на них, но саме по себе вроде не перезагружались ни разу. Снес сейчас NOD на том, что перезагружался - посмотрим. Но вот уже раз 10 подключился/отключился, вроде норм (тьфу-тьфу)...

    28 января 2010 г. 16:00
  • Я думаю все поняли, что перезагрузки вызывает NOD... Потому что у меня они прекратились... Причем на 32-й битной винде проблем с этим нет. Попробую найти последнюю версию и попробовать с частично отключенными методами наблюдения (если с новой версией перезагрузки будут продолжаться)...
    31 января 2010 г. 15:10