none
DPC_Watchdog violation 0x00000133 RRS feed

  • Вопрос

  • Приветствую всех. Нужна помощь. Ошибка BSOD (https://yadi.sk/d/O2xlrM72TsY7F) - причин может быть множество и пока не нашел решения проблеме.
    Что есть:
    OS Win 2012 R2 Standard x64 Rus.
    Материнская плата: Supermicro X9DRi-LN4+ /X9DR3-LN4+
    2 процессора по 6 ядер: Intel(R) CPU E5-2620 v2 @210GHz
    ОЗУ Kingston DIMM 8GB 1600MHz DDR3L ECC Reg CL11 DR x8 1.35V w/TS: 32Гб.
    По ошибке:
    - Начала вылетать с 13.05.14 (1й BSOD 13.05.2014 в 18.02), 3 недели стабильной работы сервера (в процессе месяца доустанавливалось ПО, и проходили штатные обновления ОС).
    - Вылетает от 1го до 3х раз, уходя в BSOD формируя дамп и минидамп.
    - Никакой нагрузки в это время на сервере нет. Температура сервера штатная (доп ПО не замерял).
    Что делал:
    - Проверил антивирусными средствами - чисто.
    - ТП майкрософта не смогла помочь, по поводу Fix'a из статьи: 2877237 не помогло (при попытке установки пишет: Не предназначен для данной системы).
    -Запустил проверку драйверов и тест ОС: пуск - вып - verifier - Не помогло. дайвера все подписанные и работают. Кроме базового видеоадаптера (Майкрософт), потому как используется видеокарта NVIDIA Quadro 600.
    -Анализ минидампа показывает только Caused by Address ntoskrnl.exe+153fa0. Последний минидамп (https://yadi.sk/d/aOE9VGwlURxsk) и полный дамп (https://yadi.sk/d/QkdJDevqURxbW)
    - Протестировал ОЗУ стандартными средствами Win 2012 - ошибок не найдено.

    Планирую сделать:
    - Откатить обновление KB2959977 за 13.05.14 - Отображается только в "Установленные обновления"
    В "Просмотр журнала обновлений" есть только 2 обновления за 13.05.14:
    KB2919355 и KB2716442.
    - Настройить IPMI для получения более полных логов во время перезагрузки сервера.
    ПРОШУ ПОМОЩИ В РЕШЕНИИ ВОЗНИКШЕЙ ПРОБЛЕМЫ. Спасибо.

    • Изменено sim_kod 22 июня 2014 г. 18:00
    22 июня 2014 г. 17:47

Ответы

  • Привет,

    Посмотрите нет ли более новых драйверов и попробуйте проделать обновление, BSOD почти всегда связан с драйверами


    Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции корпорации Microsoft. Вся информация предоставляется "как есть" без каких-либо гарантий. Не забывайте помечать сообщения как ответы и полезные, если они Вам помогли.

    23 июня 2014 г. 11:29
    Модератор
  • полный дамп (https://yadi.sk/d/QkdJDevqURxbW)

    .dmp выложить религия не позволяет?

    netbt пытается получить доступ к блокировке, которую держит какой-то драйвер (он и есть виновник всех бсодов), по таймауту система отправляет себя в бсод.

    nt!IoAcquireCancelSpinLock+0x56
    netbt!MSnodeCompletion+0x359
    Решение: надо пересмотреть стеки всех потоков на всех процессорах, найти этот драйвер и наказать :)


    MCTS: Windows iNTernals

    profile for sergmat at Stack Overflow, Q&A for professional and enthusiast programmers

    23 июня 2014 г. 13:14
  • для анализа ядерных дампов нужен ядерный движок, в студии он в ультимейт есть и в проф наверно, либо ядерный отладчик - windbg (бесплатный) от мс

    MCTS: Windows iNTernals

    profile for sergmat at Stack Overflow, Q&A for professional and enthusiast programmers

    24 июня 2014 г. 14:00
  • Решение найдено: проблема оказалась в обновленном ПО LogMeIn Hamachi 2.2.0.114, что и указывает в последнем дампе на его драйвер. Откатил на более старую рабочую версию 2.1.0.259 - уже несколько дней без BSOD работает в штатном режиме. В разных дампах в разное время указывало на различные драйвера - понадобилось обновить драйвера на всех не обновленных устройствах, пока не дошел до нужного. Так же надо учитывать, что есть специализированные закрытые форумы по различному ПО, которые не индексируются поисковиками, и оказалось что по моему коду ошибки на форуме Хамачи обсуждалась этот конфликт ПО. Причем, удивительно почему на форуме майкрософт нет информации о ПО, которое конфликтует с ними, хотя данной проблеме уже около полугода и я уверен что в майкрософт обращался не один администратор.

    • Помечено в качестве ответа sim_kod 22 июля 2014 г. 5:55
    22 июля 2014 г. 5:55

Все ответы

  • Привет,

    Посмотрите нет ли более новых драйверов и попробуйте проделать обновление, BSOD почти всегда связан с драйверами


    Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции корпорации Microsoft. Вся информация предоставляется "как есть" без каких-либо гарантий. Не забывайте помечать сообщения как ответы и полезные, если они Вам помогли.

    23 июня 2014 г. 11:29
    Модератор
  • полный дамп (https://yadi.sk/d/QkdJDevqURxbW)

    .dmp выложить религия не позволяет?

    netbt пытается получить доступ к блокировке, которую держит какой-то драйвер (он и есть виновник всех бсодов), по таймауту система отправляет себя в бсод.

    nt!IoAcquireCancelSpinLock+0x56
    netbt!MSnodeCompletion+0x359
    Решение: надо пересмотреть стеки всех потоков на всех процессорах, найти этот драйвер и наказать :)


    MCTS: Windows iNTernals

    profile for sergmat at Stack Overflow, Q&A for professional and enthusiast programmers

    23 июня 2014 г. 13:14
  • Спасибо за Советы. Подскажите наиболее удобные средства для анализа потоков в стеках процессора. Я вот думаю использовать Visual Studio Express 2013.

    24 июня 2014 г. 12:31
  • для анализа ядерных дампов нужен ядерный движок, в студии он в ультимейт есть и в проф наверно, либо ядерный отладчик - windbg (бесплатный) от мс

    MCTS: Windows iNTernals

    profile for sergmat at Stack Overflow, Q&A for professional and enthusiast programmers

    24 июня 2014 г. 14:00
  • Подскажите пожалуйста как выявить с помощью windbg драйвер который создает BSOD. До этого был файл netbt.sys а сейчас уже на хамачи ругается:

    "*** ERROR: Module load completed but symbols could not be loaded for Hamdrv.sys

    Probably caused by : Hamdrv.sys ( Hamdrv+3600 )"

    Не представляю себе пока, каким образом проанализировать стеки всех потоков на всех процессорах, да и я так понимаю что это надо сделать во время получения BSOD'а...

    1 июля 2014 г. 14:48
  • Решение найдено: проблема оказалась в обновленном ПО LogMeIn Hamachi 2.2.0.114, что и указывает в последнем дампе на его драйвер. Откатил на более старую рабочую версию 2.1.0.259 - уже несколько дней без BSOD работает в штатном режиме. В разных дампах в разное время указывало на различные драйвера - понадобилось обновить драйвера на всех не обновленных устройствах, пока не дошел до нужного. Так же надо учитывать, что есть специализированные закрытые форумы по различному ПО, которые не индексируются поисковиками, и оказалось что по моему коду ошибки на форуме Хамачи обсуждалась этот конфликт ПО. Причем, удивительно почему на форуме майкрософт нет информации о ПО, которое конфликтует с ними, хотя данной проблеме уже около полугода и я уверен что в майкрософт обращался не один администратор.

    • Помечено в качестве ответа sim_kod 22 июля 2014 г. 5:55
    22 июля 2014 г. 5:55