none
Absturz SQL Server 2012 auf Windows Server 2012 Failover-Cluster RRS feed

  • Frage

  • Hallo zusammen,

    wir haben zwei Windows Server 2012 (in einer Windows Server 2012 Domäne) in einem Failover-Cluster laufen.
    In diesem Failover-Cluster läuft eine SQL Server 2012 Instanz.

    Der SQL Server-Dienst ist uns bereits zwei mal aus für uns unerklärlichem Grund abgestürzt.

    Hier ein Auszug aus dem Failover-Cluster-Log:

    Protokollname: System
    Quelle:        Microsoft-Windows-FailoverClustering
    Datum:         30.07.2013 19:24:43
    Ereignis-ID:   1069
    Aufgabenkategorie:Ressourcensteuerungs-Manager
    Ebene:         Fehler
    Schlüsselwörter:
    Benutzer:      SYSTEM
    Computer:      xxx.xxx.local
    Beschreibung:
    Fehler in der Clusterressource "SQL Server" des Typs "SQL Server" in der Clusterrolle "SQL Server (MSSQLSERVER)".
    
    Abhängig von den Fehlerrichtlinien für die Ressource und die Rolle wird vom Clusterdienst möglicherweise versucht, die Ressource auf diesem Knoten online zu schalten oder die Gruppe auf einen anderen Knoten des Clusters zu verschieben und die Ressource dann neu zu starten. Prüfen Sie den Ressourcen- und Gruppenzustand mit dem Failovercluster-Manager oder mit dem Windows PowerShell-Cmdlet "Get-ClusterResource".
    Ereignis-XML:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" />
        <EventID>1069</EventID>
        <Version>1</Version>
        <Level>2</Level>
        <Task>3</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2013-07-30T17:24:43.024722200Z" />
        <EventRecordID>5049</EventRecordID>
        <Correlation />
        <Execution ProcessID="1356" ThreadID="8860" />
        <Channel>System</Channel>
        <Computer>xxx.xxx.local</Computer>
        <Security UserID="S-1-5-18" />
      </System>
      <EventData>
        <Data Name="ResourceName">SQL Server</Data>
        <Data Name="ResourceGroup">SQL Server (MSSQLSERVER)</Data>
        <Data Name="ResTypeDll">SQL Server</Data>
      </EventData>
    </Event>


    Sind hier irgendwelche Ursachen bekannt?


    Viele Grüße
    Mittwoch, 31. Juli 2013 13:07

Antworten

  • Hallo,

    wir hatten ein Performanceproblem (sehr geringe Übertragungsraten und hohe Latenzen) mit den RAW-Devices in diesem Cluster.

    Nach Behebung dieses Problems traten keine weiteren Abstürze auf.

    Gruß

    Phil

    Mittwoch, 7. August 2013 07:24

Alle Antworten

  • Hallo zusammen,

    der Dienst ist wieder abgestürzt, diesmal mit "mehr" Fehlermeldungen:

    Protokollname: System
    Quelle:        Microsoft-Windows-FailoverClustering
    Datum:         31.07.2013 17:10:34
    Ereignis-ID:   1069
    Aufgabenkategorie:Ressourcensteuerungs-Manager
    Ebene:         Fehler
    Schlüsselwörter:
    Benutzer:      SYSTEM
    Computer:      xxx.xxx.local
    Beschreibung:
    Fehler in der Clusterressource "SQL Server" des Typs "SQL Server" in der Clusterrolle "SQL Server (MSSQLSERVER)".
    
    Abhängig von den Fehlerrichtlinien für die Ressource und die Rolle wird vom Clusterdienst möglicherweise versucht, die Ressource auf diesem Knoten online zu schalten oder die Gruppe auf einen anderen Knoten des Clusters zu verschieben und die Ressource dann neu zu starten. Prüfen Sie den Ressourcen- und Gruppenzustand mit dem Failovercluster-Manager oder mit dem Windows PowerShell-Cmdlet "Get-ClusterResource".
    Ereignis-XML:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" />
        <EventID>1069</EventID>
        <Version>1</Version>
        <Level>2</Level>
        <Task>3</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2013-07-31T15:10:34.936826500Z" />
        <EventRecordID>5080</EventRecordID>
        <Correlation />
        <Execution ProcessID="1356" ThreadID="6984" />
        <Channel>System</Channel>
        <Computer>xxx.xxx.local</Computer>
        <Security UserID="S-1-5-18" />
      </System>
      <EventData>
        <Data Name="ResourceName">SQL Server</Data>
        <Data Name="ResourceGroup">SQL Server (MSSQLSERVER)</Data>
        <Data Name="ResTypeDll">SQL Server</Data>
      </EventData>
    </Event>

    Protokollname: System
    Quelle:        Microsoft-Windows-FailoverClustering
    Datum:         31.07.2013 17:15:41
    Ereignis-ID:   1230
    Aufgabenkategorie:Ressourcensteuerungs-Manager
    Ebene:         Fehler
    Schlüsselwörter:
    Benutzer:      SYSTEM
    Computer:      xxx.xxx.local
    Beschreibung:
    Die Clusterressource "SQL Server" (Ressourcentyp "SQL Server", DLL "sqsrvres.dll") hat nicht rechtzeitig auf eine Anforderung geantwortet. Die Clusterintegritätserkennung versucht, eine automatische Wiederherstellung auszuführen, indem der Prozess des Ressourcenhosting-Subsystems (RHS), unter dem die Ressource ausgeführt wird, beendet wird. Dies kann andere Ressourcen betreffen, die im selben RHS-Prozess gehostet werden. Die Ressourcen werden anschließend neu gestartet. 
    
    Die verdächtige Ressource "SQL Server" wird für eine Ausführung in einem isolierten RHS-Prozess markiert, um zu verhindern, dass bei einem erneuten Ressourcenfehler mehrere Ressourcen betroffen sind. Stellen Sie sicher, dass Dienste, Anwendungen oder die zugrunde liegende Infrastruktur (z. B. Speicher oder Netzwerke), die mit der verdächtigen Ressource verknüpft sind, ordnungsgemäß funktionieren.
    Ereignis-XML:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" />
        <EventID>1230</EventID>
        <Version>0</Version>
        <Level>2</Level>
        <Task>3</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2013-07-31T15:15:41.305669600Z" />
        <EventRecordID>5082</EventRecordID>
        <Correlation />
        <Execution ProcessID="1356" ThreadID="9124" />
        <Channel>System</Channel>
        <Computer>xxx.xxx.local</Computer>
        <Security UserID="S-1-5-18" />
      </System>
      <EventData>
        <Data Name="ResourceName">SQL Server</Data>
        <Data Name="ResourceType">SQL Server</Data>
        <Data Name="ResTypeDll">sqsrvres.dll</Data>
      </EventData>
    </Event>

    Protokollname: System
    Quelle:        Microsoft-Windows-FailoverClustering
    Datum:         31.07.2013 17:15:42
    Ereignis-ID:   1146
    Aufgabenkategorie:Ressourcensteuerungs-Manager
    Ebene:         Kritisch
    Schlüsselwörter:
    Benutzer:      SYSTEM
    Computer:      xxx.xxx.local
    Beschreibung:
    Das Ressourcenhosting-Subsystem (RHS) des Clusters wurde unerwartet beendet. Es wird versucht, das RHS neu zu starten. Dies ist im Allgemeinen auf die Wiederherstellung einer abgestürzten oder durch Deadlock gesperrten Ressource zurückzuführen. Stellen Sie fest, von welcher Ressource und Ressourcen-DLL das Problem verursacht wurde, und überprüfen Sie, ob die Ressource ordnungsgemäß funktioniert.
    Ereignis-XML:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" />
        <EventID>1146</EventID>
        <Version>0</Version>
        <Level>1</Level>
        <Task>3</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2013-07-31T15:15:42.717871800Z" />
        <EventRecordID>5083</EventRecordID>
        <Correlation />
        <Execution ProcessID="1356" ThreadID="9124" />
        <Channel>System</Channel>
        <Computer>xxx.xxx.local</Computer>
        <Security UserID="S-1-5-18" />
      </System>
      <EventData>
        <Data Name="NodeName">xxx</Data>
      </EventData>
    </Event>

    Viele Grüße

    Donnerstag, 1. August 2013 05:38
  • Wie sehen die Ressourcen-Abhängigkeiten aus?

    Was sagt der aktuelle Cluster Validation Report? Wenn kein aktueller vorhanden, unbedingt einen Neuen erstellen. Klingt fast wie nach einem Resource-Deadlock.


    Andreas Wolter | Microsoft Certified Master SQL Server

    Blog: www.insidesql.org/blogs/andreaswolter
    Web: www.andreas-wolter.com


    Samstag, 3. August 2013 21:54
  • Hallo,

    wir hatten ein Performanceproblem (sehr geringe Übertragungsraten und hohe Latenzen) mit den RAW-Devices in diesem Cluster.

    Nach Behebung dieses Problems traten keine weiteren Abstürze auf.

    Gruß

    Phil

    Mittwoch, 7. August 2013 07:24
  • Hallo Phil,

    darf ich fragen um welche Übertragungsraten es ging?

    Wir planen auch gerade einen FailoverCluster mit Alwayson Availability Groups standortübergreifend aufzubauen und haben eine 100 mBit Leitung zur Verfügung.

    Vielen Dank

    Dirk

    Dienstag, 8. Dezember 2015 08:30