Benutzer mit den meisten Antworten
Verhalten bei Ausfall des Heartbeats

Frage
-
Hallo zusammen,
2012 Cluster aus zwei Nodes mit Disc-Quorum, Shared-Storage per iSCSI.
was passiert bei einem Ausfall des Heartbeat-Netzwerkes?
Welcher Node ist der "Überlebende" und was macht der andere Node?
Gruß
Davorin
- Bearbeitet Davorin Scharping Dienstag, 23. April 2013 09:26
Antworten
-
Hi Davorin
Jeder der Knoten weiß, wie die Quorum innerhalb des Cluster aussieht - wie also die Stimmen verteilt sind. In Deinem Fall hast Du eine Quorum von 2. Jeder Node hat eine Stimme und die Witness-Disk ebenfalls eine. Verlieren nun die Nodes die Verbindung zueinander - sprich der Heartbeat schlägt fehl, schaut jeder der Knoten ob er die Witness Disk erreichen kann um mit ihr die Mehrheit (das Quorum) zu bilden. Für den Node welcher ohnehin diese Disk hat ändert sich erstmal nichts, außer das er den anderen Node welcher nicht mehr erreichbar ist aus dem Cluster wirft. Gleichzeitig ist die Witess Disk mit einem persistent Lock versehen. Für den Fall, dass der andere Node ohnehin die Witness Disk und den anderen Node nicht mehr sieht - stellt dieser den Cluster Dienst ein und fertig. Für den Fall, dass lediglich die Kommunikation zum anderen Node weg ist, aber die Witness Disk erreichbar (häufig bei Fibre-Channel Konfigurationen), zieht das Challange-Defense Protokoll und der Node überlebt welcher den Lock gelegt hat (mehr oder weniger First-Come ...) - mal so ganz grob.
Viele Grüße, Bernd Pfann [Microsoft] - This posting is provided "AS IS" with no warranties, and confers no rights.
- Als Antwort markiert Davorin Scharping Dienstag, 23. April 2013 09:25
Alle Antworten
-
Wenn der Cluster unseren Empfehlungen entspricht passiert nichts :-)
Um es ein wenig genauer auszudrücken:
Zwischen den beiden Knoten sollten mindestens 2 Netzwerkverbindungen vorhanden sein und über beide läuft der Heartbeat. Insofern ist das kein Problem!
Wenn es aber dazu kommt, über keine der Netzwerkverbindungen die Heartbeat-Pakete mehr übertragen werden können gewinnt der Knoten welcher die Quorum bilden kann - sprich die Witness-Disk besitzt. Da Du von iSCSI sprachst, hast Du ja ausschließlich Ethernet / IP als Protokoll zur Verfügung - hier wäre eine genaue Konfig interessant (wie viele NICs, Teaming, ... MPIO) dann können wir dir exakt sagen was bei einem Ausfall so abgeht.
Nur weil bei Windows 2012 fast alles machbar ist - ist es nicht einfacher geworden ;-)
Viele Grüße, Bernd Pfann [Microsoft] - This posting is provided "AS IS" with no warranties, and confers no rights.
-
Wenn es aber dazu kommt, über keine der Netzwerkverbindungen die Heartbeat-Pakete mehr übertragen werden können gewinnt der Knoten welcher die Quorum bilden kann - sprich die Witness-Disk besitzt. Da Du von iSCSI sprachst, hast Du ja ausschließlich Ethernet / IP als Protokoll zur Verfügung - hier wäre eine genaue Konfig interessant (wie viele NICs, Teaming, ... MPIO) dann können wir dir exakt sagen was bei einem Ausfall so abgeht.
Viele Grüße, Bernd Pfann [Microsoft] - This posting is provided "AS IS" with no warranties, and confers no rights.
Hallo Bernd,
in meiner kleinen Testumgebung habe ich nur ein Netzwerk zwischen den beiden Cluster-Nodes (FS2 und FS3). Beide sind VMs auf Hyper-V, auf unterschiedlichen, nicht geclusterten Hyper-V Server 2008R2.
Das Shared Storage wird mittels iSCSI durch eine weitere VM (vstorage1) zur Verfügung gestellt.Wenn nun das (eine) Netzwerk ausfällt, dann fühlt sich der active Node als "Überlebender", weil er ja das Disc-Quorum besitzt. Ist ja auch einleuchtend, wenn denn der passive Node ausfällt.
Der passive Node ist aber auch noch online, woher weiß dieser, dass er eben nicht der einzige Online-Überlebende hat, weil der active Node mit Disc-Quorum ausgefallen ist (nicht mehr online), sondern in diesem Fall ja nur die Verbindung ausgefallen ist (beide online).
Wie erkennen die Cluster Nodes, dass nur das Netzwerk ausgefallen ist und beide Nodes noch online sind, im Gegensatz zum Ausfall eines Nodes (einer online, einer offline)? Es kann ja auch mal das ganze Netzwerk (Management, Heartbeat, Arbeitsnetz, Backup) ausfallen.
Gruß
Davorin -
Hi Davorin
Jeder der Knoten weiß, wie die Quorum innerhalb des Cluster aussieht - wie also die Stimmen verteilt sind. In Deinem Fall hast Du eine Quorum von 2. Jeder Node hat eine Stimme und die Witness-Disk ebenfalls eine. Verlieren nun die Nodes die Verbindung zueinander - sprich der Heartbeat schlägt fehl, schaut jeder der Knoten ob er die Witness Disk erreichen kann um mit ihr die Mehrheit (das Quorum) zu bilden. Für den Node welcher ohnehin diese Disk hat ändert sich erstmal nichts, außer das er den anderen Node welcher nicht mehr erreichbar ist aus dem Cluster wirft. Gleichzeitig ist die Witess Disk mit einem persistent Lock versehen. Für den Fall, dass der andere Node ohnehin die Witness Disk und den anderen Node nicht mehr sieht - stellt dieser den Cluster Dienst ein und fertig. Für den Fall, dass lediglich die Kommunikation zum anderen Node weg ist, aber die Witness Disk erreichbar (häufig bei Fibre-Channel Konfigurationen), zieht das Challange-Defense Protokoll und der Node überlebt welcher den Lock gelegt hat (mehr oder weniger First-Come ...) - mal so ganz grob.
Viele Grüße, Bernd Pfann [Microsoft] - This posting is provided "AS IS" with no warranties, and confers no rights.
- Als Antwort markiert Davorin Scharping Dienstag, 23. April 2013 09:25