Benutzer mit den meisten Antworten
Absturz SQL Server 2012 auf Windows Server 2012 Failover-Cluster

Frage
-
Hallo zusammen,
wir haben zwei Windows Server 2012 (in einer Windows Server 2012 Domäne) in einem Failover-Cluster laufen.
In diesem Failover-Cluster läuft eine SQL Server 2012 Instanz.
Der SQL Server-Dienst ist uns bereits zwei mal aus für uns unerklärlichem Grund abgestürzt.
Hier ein Auszug aus dem Failover-Cluster-Log:
Protokollname: System Quelle: Microsoft-Windows-FailoverClustering Datum: 30.07.2013 19:24:43 Ereignis-ID: 1069 Aufgabenkategorie:Ressourcensteuerungs-Manager Ebene: Fehler Schlüsselwörter: Benutzer: SYSTEM Computer: xxx.xxx.local Beschreibung: Fehler in der Clusterressource "SQL Server" des Typs "SQL Server" in der Clusterrolle "SQL Server (MSSQLSERVER)". Abhängig von den Fehlerrichtlinien für die Ressource und die Rolle wird vom Clusterdienst möglicherweise versucht, die Ressource auf diesem Knoten online zu schalten oder die Gruppe auf einen anderen Knoten des Clusters zu verschieben und die Ressource dann neu zu starten. Prüfen Sie den Ressourcen- und Gruppenzustand mit dem Failovercluster-Manager oder mit dem Windows PowerShell-Cmdlet "Get-ClusterResource". Ereignis-XML: <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event"> <System> <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" /> <EventID>1069</EventID> <Version>1</Version> <Level>2</Level> <Task>3</Task> <Opcode>0</Opcode> <Keywords>0x8000000000000000</Keywords> <TimeCreated SystemTime="2013-07-30T17:24:43.024722200Z" /> <EventRecordID>5049</EventRecordID> <Correlation /> <Execution ProcessID="1356" ThreadID="8860" /> <Channel>System</Channel> <Computer>xxx.xxx.local</Computer> <Security UserID="S-1-5-18" /> </System> <EventData> <Data Name="ResourceName">SQL Server</Data> <Data Name="ResourceGroup">SQL Server (MSSQLSERVER)</Data> <Data Name="ResTypeDll">SQL Server</Data> </EventData> </Event>
Sind hier irgendwelche Ursachen bekannt?
Viele Grüße- Typ geändert Raul TalmaciuMicrosoft contingent staff Mittwoch, 7. August 2013 06:50 Warten auf Feedback
- Typ geändert Raul TalmaciuMicrosoft contingent staff Mittwoch, 7. August 2013 07:31
Antworten
-
Hallo,
wir hatten ein Performanceproblem (sehr geringe Übertragungsraten und hohe Latenzen) mit den RAW-Devices in diesem Cluster.
Nach Behebung dieses Problems traten keine weiteren Abstürze auf.
Gruß
Phil
- Als Antwort markiert Raul TalmaciuMicrosoft contingent staff Mittwoch, 7. August 2013 07:31
Alle Antworten
-
Hallo zusammen,
der Dienst ist wieder abgestürzt, diesmal mit "mehr" Fehlermeldungen:
Protokollname: System Quelle: Microsoft-Windows-FailoverClustering Datum: 31.07.2013 17:10:34 Ereignis-ID: 1069 Aufgabenkategorie:Ressourcensteuerungs-Manager Ebene: Fehler Schlüsselwörter: Benutzer: SYSTEM Computer: xxx.xxx.local Beschreibung: Fehler in der Clusterressource "SQL Server" des Typs "SQL Server" in der Clusterrolle "SQL Server (MSSQLSERVER)". Abhängig von den Fehlerrichtlinien für die Ressource und die Rolle wird vom Clusterdienst möglicherweise versucht, die Ressource auf diesem Knoten online zu schalten oder die Gruppe auf einen anderen Knoten des Clusters zu verschieben und die Ressource dann neu zu starten. Prüfen Sie den Ressourcen- und Gruppenzustand mit dem Failovercluster-Manager oder mit dem Windows PowerShell-Cmdlet "Get-ClusterResource". Ereignis-XML: <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event"> <System> <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" /> <EventID>1069</EventID> <Version>1</Version> <Level>2</Level> <Task>3</Task> <Opcode>0</Opcode> <Keywords>0x8000000000000000</Keywords> <TimeCreated SystemTime="2013-07-31T15:10:34.936826500Z" /> <EventRecordID>5080</EventRecordID> <Correlation /> <Execution ProcessID="1356" ThreadID="6984" /> <Channel>System</Channel> <Computer>xxx.xxx.local</Computer> <Security UserID="S-1-5-18" /> </System> <EventData> <Data Name="ResourceName">SQL Server</Data> <Data Name="ResourceGroup">SQL Server (MSSQLSERVER)</Data> <Data Name="ResTypeDll">SQL Server</Data> </EventData> </Event>
Protokollname: System Quelle: Microsoft-Windows-FailoverClustering Datum: 31.07.2013 17:15:41 Ereignis-ID: 1230 Aufgabenkategorie:Ressourcensteuerungs-Manager Ebene: Fehler Schlüsselwörter: Benutzer: SYSTEM Computer: xxx.xxx.local Beschreibung: Die Clusterressource "SQL Server" (Ressourcentyp "SQL Server", DLL "sqsrvres.dll") hat nicht rechtzeitig auf eine Anforderung geantwortet. Die Clusterintegritätserkennung versucht, eine automatische Wiederherstellung auszuführen, indem der Prozess des Ressourcenhosting-Subsystems (RHS), unter dem die Ressource ausgeführt wird, beendet wird. Dies kann andere Ressourcen betreffen, die im selben RHS-Prozess gehostet werden. Die Ressourcen werden anschließend neu gestartet. Die verdächtige Ressource "SQL Server" wird für eine Ausführung in einem isolierten RHS-Prozess markiert, um zu verhindern, dass bei einem erneuten Ressourcenfehler mehrere Ressourcen betroffen sind. Stellen Sie sicher, dass Dienste, Anwendungen oder die zugrunde liegende Infrastruktur (z. B. Speicher oder Netzwerke), die mit der verdächtigen Ressource verknüpft sind, ordnungsgemäß funktionieren. Ereignis-XML: <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event"> <System> <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" /> <EventID>1230</EventID> <Version>0</Version> <Level>2</Level> <Task>3</Task> <Opcode>0</Opcode> <Keywords>0x8000000000000000</Keywords> <TimeCreated SystemTime="2013-07-31T15:15:41.305669600Z" /> <EventRecordID>5082</EventRecordID> <Correlation /> <Execution ProcessID="1356" ThreadID="9124" /> <Channel>System</Channel> <Computer>xxx.xxx.local</Computer> <Security UserID="S-1-5-18" /> </System> <EventData> <Data Name="ResourceName">SQL Server</Data> <Data Name="ResourceType">SQL Server</Data> <Data Name="ResTypeDll">sqsrvres.dll</Data> </EventData> </Event>
Protokollname: System Quelle: Microsoft-Windows-FailoverClustering Datum: 31.07.2013 17:15:42 Ereignis-ID: 1146 Aufgabenkategorie:Ressourcensteuerungs-Manager Ebene: Kritisch Schlüsselwörter: Benutzer: SYSTEM Computer: xxx.xxx.local Beschreibung: Das Ressourcenhosting-Subsystem (RHS) des Clusters wurde unerwartet beendet. Es wird versucht, das RHS neu zu starten. Dies ist im Allgemeinen auf die Wiederherstellung einer abgestürzten oder durch Deadlock gesperrten Ressource zurückzuführen. Stellen Sie fest, von welcher Ressource und Ressourcen-DLL das Problem verursacht wurde, und überprüfen Sie, ob die Ressource ordnungsgemäß funktioniert. Ereignis-XML: <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event"> <System> <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" /> <EventID>1146</EventID> <Version>0</Version> <Level>1</Level> <Task>3</Task> <Opcode>0</Opcode> <Keywords>0x8000000000000000</Keywords> <TimeCreated SystemTime="2013-07-31T15:15:42.717871800Z" /> <EventRecordID>5083</EventRecordID> <Correlation /> <Execution ProcessID="1356" ThreadID="9124" /> <Channel>System</Channel> <Computer>xxx.xxx.local</Computer> <Security UserID="S-1-5-18" /> </System> <EventData> <Data Name="NodeName">xxx</Data> </EventData> </Event>
Viele Grüße
-
Wie sehen die Ressourcen-Abhängigkeiten aus?
Was sagt der aktuelle Cluster Validation Report? Wenn kein aktueller vorhanden, unbedingt einen Neuen erstellen. Klingt fast wie nach einem Resource-Deadlock.
Andreas Wolter | Microsoft Certified Master SQL Server
Blog: www.insidesql.org/blogs/andreaswolter
Web: www.andreas-wolter.com- Bearbeitet Andreas.WolterMicrosoft employee Samstag, 3. August 2013 21:55
-
Hallo,
bist Du hier weitergekommen?
Gruss,
RaulRaul Talmaciu, MICROSOFT
Bitte haben Sie Verständnis dafür, dass im Rahmen dieses Forums, welches auf dem Community-Prinzip „IT-Pros helfen IT-Pros“ beruht, kein technischer Support geleistet werden kann oder sonst welche garantierten Maßnahmen seitens Microsoft zugesichert werden können. -
Hallo,
wir hatten ein Performanceproblem (sehr geringe Übertragungsraten und hohe Latenzen) mit den RAW-Devices in diesem Cluster.
Nach Behebung dieses Problems traten keine weiteren Abstürze auf.
Gruß
Phil
- Als Antwort markiert Raul TalmaciuMicrosoft contingent staff Mittwoch, 7. August 2013 07:31
-