Fragensteller
Windows SBS 2003 Absturz / Bluescreen

Frage
-
Hallo zusammen!
In letzter Zeit stürzt unser Server ca. einmal pro Tag ab. Der Bluescreen zeigt den Fehler Memory Management an.
Nachdem der Server wieder hochgefahren und die Fehlerberichterstattung abgeschlossen ist, öffnet sich der IE mit der Microsoft Error Reporting Website.
Hier wird folgendes angezeigt: Problem wird verursacht durch Device Driver. Lösungsvorschläge gibt es nicht.
Ich habe erst angenommen, dass der Adaptec Controller 2100S die Probleme macht, da das Symantec Backup Exec jedes Mal berichtet hat:
Der Treiber hat einen Controllerfehler auf \Device\Scsi\dpti2o1 gefunden.
Das Bandlaufwerk ist ein IBM / Quantum DLT VS 80. Hier die verschiedenen Treiber von IBM, Quantum und Symantec installiert als auch das Laufwerk einem vollständigen Test mit dem Diagnoseprogramm xTalk unterzogen, sowie ein Firmware update gemacht. -> Keine Veränderung.
Daraufhin habe ich den Adaptec Controller deinstalliert und ausgebaut und auch das Laufwerk vom Server genommen.
Danach lief der Server ca. 1 Woche stabil durch, bis dann plötzlich der Bluescreen wieder aufgetaucht und alles beim Alten ist.
Obwohl ich alles deinstalliert hatte, ist die Datei dpti2o.sys in Windows\System32\drivers übriggeblieben.
Diese lässt sich zwar löschen wird aber automatisch wieder hergestellt, obwohl der Treiber von Adaptec ist.
Das Backup Exec gibt auch weiterhin die Meldung aus "Der Treiber hat einen Controllerfehler auf \Device\Scsi\dpti2o1 gefunden" aus, obwohl die Adaptec Karte ausgebaut ist.
Das Ereignisprotokoll gibt folgende Meldung aus:
unerwartetes Herunterfahren des Computers: Systemfehler: Abbruchfehler
Begründung: Code: 0x805000f
Fehlerkennung:
Fehlercheckzeichenfolge: 0x0000001a (0x00003452, 0x012cc219, 0xc0883240, 0x00000080)
Kommentar: 0x0000001a (0x00003452, 0x012cc219, 0xc0883240, 0x00000080)
Unter dem Stopfehler 0x805000f findet man zwar einiges im Technet, jedoch nicht mit der Fehercheckzeichenfolge 0x0000001a.
Angaben zum System:
Fujitsu Siemens TX150 S5
Intel Xeon CPU 3040
2x 2GB RAM
Windows SBS 2003 Premium Edition SP1
Windows Server 2003 SP2
SQL Server 2008 Standard Edition
Exchange Server 2003
Vielen Dank für Eure Bemühungen!
Mirko
Alle Antworten
-
Hi Mirko,hast du denn damals im Adaptec Storage Manager nachgeschaut, ob dort irgendwelche Media Errors für die HDDs aufgeführt werden ? An welchen Controller hängt denn das DLT Laufwerk? Welchen Controller hast du denn anstatt des Adaptec Controllers eingebaut? Kann es sein, dass sich auf dem Mainboard ein Onboard Adaptec Controller befindet? Fragen über Fragen...GrußMartin
-
Hallo Martin,
ich glaube da habe ich ein paar Informationen vorenthalten.
Der Adaptec Controller dient nur als SCSI-Schnittstelle für das Bandlaufwerk, ein RAID auf dem Adaptec ist nicht eingerichtet.
Die beiden HDDs (S-ATA) sind am Onboard LSi Logic Embedded MegaRAID angeschlossen. Diese Konfig lief jetzt über 2 Jahre einwandfrei.
Die ServerView Agent Diagnose von Fujitsu Siemens gibt keine Fehler aus.
Habe gestern bemerkt, dass sich der "Nicht PnP Treiber" dpti2o wieder installiert hat. Dieser führt natürlich genau zur Treiberdatei dpti2o.sys.
Ist das eine Microsoft Systemdatei, die von Adaptec überschrieben wurde? Oder ist die Angabe falsch, dass sie von Adaptec ist?
Kann man die automatische Wiederherstellung abschalten, oder ist diese Datei für die Systemstabilität wichtig?
Gibt es eine Alternative herauszufinden, ob diese Datei überhaupt verantwortlich ist?
Die Microsoft Error Reporting Website gibt als Ursache Device Driver an, der Bluescreen wiederum gibt Memory Management aus.
Also habe ich mir den Hauptspeicher angeschaut. Vor einem halben Jahr haben wir diesen von 2 auf 4 erweitert.
Haben die Erweiterung von einer IT-Firma bekommen, und ich habe sie nicht weiter überprüft.
Die Erweiterungen sind nicht wie die Originale 677 MHz, sondern 533 MHz Module. Das Ganze läuft als Dual Channel.
Der Speicher ist aber von Kingston für diesen Server zertifiziert.
Kann es evtl. auch hieran liegen, aber warum läuft es vorher 6 Monate fehlerfrei?
Ich werde den Speicher heute Abend mal ausbauen.
Bin sonst für jegliche Vorschläge dankbar!
Mirko -
nun ja, wenn es vorher über ein halbes Jahr ohne Probleme lief, dann wird es sich dabei mit sehr hoher Wahrscheinlichkeit um einen Hardwarefehler handeln.dpti2o.sys ist eine Controller Treiber Datei von Adaptec. Den hast du aber nun ausgebaut? Welche Karte hast du denn statt dessen eingebaut?GrußMartin
-
Habe den Speicher gestern ausgebaut, aber kurze Zeit später ist der Server wieder agbeschmiert.
Ich habe keinen anderen Controller eingebaut, die HDDs laufen über den Onboard RAID und Sicherung läuft solange extern.
Ich kann mir inzwischen aber auch nicht mehr vorstellen, dass es daran liegt, da der Server mit und ohne Karte abstürzt.
Kann der Server eigentlich so eingestellt werden, dass er im Falle eines BlueScreens automatisch neu startet und kein Benutzereingriff notwendig ist?
Gruß
Mirko -
Das könnte man natürlich, aber es wirkt nicht wirklich professionel ;-). Bei deinem Fall wäre es sicher nicht verkehrt, einamal das Speicherabbild mit den MS Debugging Tools auszuwerten.
Hast du den Adaptec Ctrl. aus der Systemsteuerung entfernt? -
Das sollte ja auch nicht die Lösung sein!! Da der Server allerdings auch gebraucht wird, wenn ich nicht in der Firma bin wäre es nur hilfreich gewesen.
Da ich den Controller ausschließen konnte, habe ich dem Arbeitsspeicher mal ordentlich eingeheizt.
Und siehe da, endlich eine ordentliche Fehlermeldung! Und zwar bei einem original RAM Modul.
Also habe ich mich direkt aufgemacht und Speicher besorgt, aber alles ausgetauscht.
Heute Nacht keinen Absturz gehabt und Sicherung lief auch schön durch.
Bin guter Dinge, dass es daran gelegen hat. Werde das jetzt noch mal ne Woche beobachten.
Hatte der Bluescreen also von Anfang an Recht. Dass der Server eine Woche lang ruhig lief, nachdem ich den Controller ausgebaut hatte war wohl
einfach nur dummer Zufall! ;-( -
Leider zu früh gefreut!
Pünktlich nach 6 Tagen hatte ich gestern Abend wieder meinen heißgeliebten Bluescreen und heute Nacht einen weiteren Absturz.
Das Debugging Tool gibt folgendes aus:
Microsoft (R) Windows Debugger Version 6.11.0001.404 X86
Copyright (c) Microsoft Corporation. All rights reserved.
Loading Dump File [C:\WINDOWS\Minidump\Mini112509-01.dmp]
Mini Kernel Dump File: Only registers and stack trace are availableSymbol search path is: SRV*C:\Symbols*http://msdl.microsoft.com/download/symbols
Executable search path is:
Windows Server 2003 Kernel Version 3790 (Service Pack 2) MP (2 procs) Free x86 compatible
Product: LanManNt, suite: SmallBusiness TerminalServer SmallBusinessRestricted SingleUserTS
Built by: 3790.srv03_sp2_gdr.090805-1438
Machine Name:
Kernel base = 0x80800000 PsLoadedModuleList = 0x808a6ea8
Debug session time: Wed Nov 25 04:32:41.500 2009 (GMT+1)
System Uptime: 0 days 11:22:25.261
Loading Kernel Symbols
...............................................................
................................................................
....
Loading User Symbols
Loading unloaded module list
...
*******************************************************************************
* *
* Bugcheck Analysis *
* *
*******************************************************************************Use !analyze -v to get detailed debugging information.
BugCheck 1A, {3452, 112f201, c0884844, 80}
Probably caused by : memory_corruption ( nt!MiDeleteAddressesInWorkingSet+155 )
Followup: MachineOwner
---------1: kd> !analyze -v
*******************************************************************************
* *
* Bugcheck Analysis *
* *
*******************************************************************************MEMORY_MANAGEMENT (1a)
# Any other values for parameter 1 must be individually examined.
Arguments:
Arg1: 00003452, The subtype of the bugcheck.
Arg2: 0112f201
Arg3: c0884844
Arg4: 00000080Debugging Details:
------------------
BUGCHECK_STR: 0x1a_3452CUSTOMER_CRASH_COUNT: 1
DEFAULT_BUCKET_ID: DRIVER_FAULT_SERVER_MINIDUMP
PROCESS_NAME: spoolsv.exe
CURRENT_IRQL: 0
LAST_CONTROL_TRANSFER: from 8084c6f1 to 80827c83
STACK_TEXT:
f53bca8c 8084c6f1 0000001a 00003452 0112f201 nt!KeBugCheckEx+0x1b
f53bcc48 8084c83b 8ac3f020 8ac3f020 00000000 nt!MiDeleteAddressesInWorkingSet+0x155
f53bcc68 8094c4ef 8ac3f248 867bc978 00000080 nt!MmCleanProcessAddressSpace+0x111
f53bccf0 8094c56d 00000080 f53bcd4c 8082e0d6 nt!PspExitThread+0x5f1
f53bccfc 8082e0d6 867bc978 f53bcd48 f53bcd3c nt!PsExitSpecialApc+0x1d
f53bcd4c 80889867 00000001 00000000 f53bcd64 nt!KiDeliverApc+0x1ae
f53bcd4c 7c94860c 00000001 00000000 f53bcd64 nt!KiServiceExit+0x56
WARNING: Frame IP not in any known module. Following frames may be wrong.
00a2f874 00000000 00000000 00000000 00000000 0x7c94860c
STACK_COMMAND: kbFOLLOWUP_IP:
nt!MiDeleteAddressesInWorkingSet+155
8084c6f1 cc int 3SYMBOL_STACK_INDEX: 1
SYMBOL_NAME: nt!MiDeleteAddressesInWorkingSet+155
FOLLOWUP_NAME: MachineOwner
MODULE_NAME: nt
DEBUG_FLR_IMAGE_TIMESTAMP: 4a799091
IMAGE_NAME: memory_corruption
FAILURE_BUCKET_ID: 0x1a_3452_nt!MiDeleteAddressesInWorkingSet+155
BUCKET_ID: 0x1a_3452_nt!MiDeleteAddressesInWorkingSet+155
Followup: MachineOwner
---------1: kd> lmvm nt
start end module name
80800000 80a5b000 nt # (pdb symbols) c:\symbols\ntkrpamp.pdb\81143165DF564A62956C4EF4CFE2C62F1\ntkrpamp.pdb
Loaded symbol image file: ntkrpamp.exe
Mapped memory image file: C:\Symbols\ntkrpamp.exe\4A79909125b000\ntkrpamp.exe
Image path: ntkrpamp.exe
Image name: ntkrpamp.exe
Timestamp: Wed Aug 05 16:00:49 2009 (4A799091)
CheckSum: 0023C469
ImageSize: 0025B000
File version: 5.2.3790.4566
Product version: 5.2.3790.4566
File flags: 0 (Mask 3F)
File OS: 40004 NT Win32
File type: 1.0 App
File date: 00000000.00000000
Translations: 0405.04b0
CompanyName: Microsoft Corporation
ProductName: Operační systém Microsoft® Windows®
InternalName: ntkrpamp.exe
OriginalFilename: ntkrpamp.exe
ProductVersion: 5.2.3790.4566
FileVersion: 5.2.3790.4566 (srv03_sp2_gdr.090805-1438)
FileDescription: NT Kernel & System
LegalCopyright: © Microsoft Corporation. Všechna práva vyhrazena.
Sieht anscheinend wieder nach Speicher aus, den ich aber doch ausgetauscht habe!?
Kann es evtl. auch der Dimm-Slot sein bzw. das Motherboard?
Um nochmal auf den Controller zurückzukommen, könnte es auch der RAM auf dem Controller sein? -
Könnte es vielleicht sein, dass das Mainboard des System an den Kondensatoren Bläschen schlägt? Ich habe auch so ein Sorgenkind, bei mir ist es allerdings ein Temperaturproblem: Das System wird zu kalt ;)
Ist bei mir allerdings nur vorrübergehend, dass das System da stehen muss, aber vielleicht hilft es ja als Denkanstoß -
Hallo mm2knet,
Danke für Deine Antwort.
Bei mir dürfte es das nicht sein. Laut meinem Dump-File hat es mit spoolsv.exe und/oder ntoskrnl.exe zu tun.
Beide Dateien habe ich ausgetauscht. Leider ohne Erfolg. Sobald ich z.B. einen Virenscan drüberlaufen lasse, bekomme ich einen Bluescreen wenn er beim system32-Verzeichnis ist. Scanne ich dieses Verzeichnis alleine, funktioniert es aber. MIr kommt vor, dass er den BS immer dann bekommt, wenn er unter Stress ist. Aber auch nicht immer. Manchmal läuft die Sicherung durch und er bekommt den BS erst zwei Stunden nach Abschluss der Sicherung. Dann läuft er wieder für zwei Tage problemlos durch. Ein anderes Mal bekommt er den BS zwei Mal täglich.
Sehr komisch das Ganze. -
Hallo Mirko 9000 und alle weiteren Beteiligten,
leider kann ich auch nicht mit einer Antwort aufwarten, ich suche seit 26.102009 nach einer Lösung für ein ähnliches Problem. Bei unserem SBS2003 kam dieser Fehler das erste Mal nach gut fünf Monaten Laufzeit, ohne dass es Änderungen (außer den regelmäßigen Updates von MS) gegeben hat.
Der blue screen gibt mir ein IRQL_NOT_LESS_OR_EQUAL mit STOP:0x1000000a (0x00000025, 0xd000001b, 0x00000001, 0x8083d05e) und ***ntoskernl.exe - Address ..... (kann auf Wunsch auch eingetragen werden). Im eventvwr habe ich einige Fehler, beginnend mit Applikation Popup 333, dazu habe ich verschiedene Hinweise gefunden (KB 970054), Überwachung mit poolmon ergibt, das der tag "THRE" (none paged pool memory) sich permanent aufbaut, leider kann ich dem keinen Treiber zuordnen (sind einfach zuviele, die bei der Suche nach Findstr/m/l THRE *.sys als Ergebnis angezeigt werden) , alle weiteren Fehler bauen auf den 333 auf und die Suche auf eventid.net hat auch nichts gebracht.. Dank der Beschreibung des KB970054 wird der Fehler 333 zwar nicht mehr geschrieben, und im Produktivsystem habe ich den Bluescreen auch ausgeschaltet, aber ich muss den Server einmal die Woche manuell starten, damit die Kollegen arbeiten können. Die Kopie des Servers läuft als virtuelle Maschine und produziert den gleichen Fehler. Da ich aber keine Ausbildung zum Analysieren von Dumpfiles habe, und bei der Eingabe des Befehls !analyse -v der Hinweis "no export analyse found" kommt, kann mir vielleicht hier jemand einen Tipp fürs weitere Verfahren geben? In den erweiterten Systemeigenschaften habe ich für Systemfehler jetzt das vollständige Speicherabbild eingestellt. Aber in der Testumgebung dauert es ca. 10 Tage nach serverstart, bis der bluescreen kommt.