none
Server 2008 R2 HyperV: Nur noch ein Knoten Zugriff auf den Clusterstorage? RRS feed

  • Frage

  • Nabend,

    habe einen Cluster mit zwei Knoten laufen. Als OS dient bei mir der Server 2008 R2. Sind zwei identische Dell Power Edge Server.
    Storage ist ein Dell MD3200i. Die Knoten sind per iSCSI mit dem Storage verbunden.

    In der Vergangenheit konnten immer beide Knoten gleichzeitig auf den Cluster Speicher zugreifen. Das ist doch auch einer der großen Vorteile durch CSV,..?
    Heute hatte ich zwei Fehler im Ereignislog

    Fehler beim Registrieren des Dienstprinzipalnamens.

    und

    Unerwarteter Anbieterfehler. Möglicherweise kann das Problem durch erneutes Starten des Dienstes behoben werden. Fehlercode: 80004005@02000014

    seitdem kann nur noch der aktuelle Besitzer des Clustervolumes auf den Speicher zugreifen.
    Beim Zugriff auf den Speicher vom zweiten Knoten erschien folgende Fehlermeldung:

    Auf die Virtual Machines-Konfiguration 14C27FB6-8858-4FE2-A70F-0A12561F653E unter "C:\ClusterStorage\Volume1\HyperV" kann nicht mehr zugegriffen werden: 
    Der Server des Sicherheitskonten-Managers (SAM, Security Account Manager) oder der lokalen Sicherheitsautorität (LSA, Local Security Authority) befand sich in einem
    Zustand, in dem der Sicherheitsvorgang nicht durchgeführt werden kann. (0x80070548)

    Habe beide Knoten bereits neugestartet (nacheinander). Umgeleiteter Speicher ist auch nicht aktiviert.

    Nu läuft natürlich meine livemigration nicht mehr :(
    Noch eine Idee was ich machen kann? Oder fehlen noch wichtige Angaben?

    Vielen Dank schon mal!

    Gruß,
    Pascal Meger

    Mittwoch, 13. April 2011 20:35

Antworten

  • So, hab es hinbekommen.

    Problem war: Der "Client für Microsoft Netzwerke" und "Datei- und Druckerfreigabe" waren auf dem ersten Node auf der Netzwerkkarte für den Cluster intern Betrieb deaktiviert.
    Das wird wohl (warum auch immer) durch den Absturz des Systems verursacht wurden sein?

    Aber noch zu den Punkten von Bernd:
    IP Problem war es dann wohl nicht direkt, mehr ein "Client" Problem?
    Habe 4 Verbindungen pro Node zum Storage.
    iSCSI Initiator hat auch alles als connected angezeigt.

     

     

    • Als Antwort markiert PascalMeger Dienstag, 19. April 2011 18:29
    • Tag als Antwort aufgehoben PascalMeger Dienstag, 19. April 2011 18:55
    • Als Antwort markiert PascalMeger Dienstag, 19. April 2011 18:55
    Dienstag, 19. April 2011 18:29

Alle Antworten

  • In der Datenträgerverwaltung sehe ich mein Quorum und den Clusterspeicher als "Reserviert (Der Datenträger ist aufgrund einer vom Administrator festgelegten Richtlinie offline)".

    Das kenne ich eigentlich nur von HyperV bis Server 2008 R2. Bei R2 habe ich das noch nicht gesehen,..

    Donnerstag, 14. April 2011 06:31
  • Hallo Pascal

    Verstehe ich das richtig, ein Knoten funktioniert noch und der andere nicht. Deine VMs laufen alle nun auf einem Knoten?

     


    Viele Grüße, Bernd Pfann [Microsoft] - This posting is provided "AS IS" with no warranties, and confers no rights.
    Donnerstag, 14. April 2011 14:07
    Moderator
  • Hallo Bernd,

    nene. Es laufen beide Knoten. Aber es ist schon richtig das alle VMs derzeit auf nur einem Knoten laufen. Wenn ich diesen aber runterfahre, sind die VMs kurz drauf auf dem anderen Knoten verfügbar. Ich kann die VMs aber nicht per LiveMigration übertragen, es hat leider nur der aktuelle Besitzer Zugriff auf den Cluster Storage :(

    Oder sollte ich einfach mal beide Knoten gleichzeitg runterfahren, Storage abschalten, Storage einschalten und Knoten der Reihe nach wieder hochfahren?
    Ich habe echt keine Idee was ich sonst machen könnte. Es wurden keine Updates oder sonstige Software installieret.

    Donnerstag, 14. April 2011 17:59
  • Hallo Pascal

    Ich tue mich mal wieder mit den deutschen Fehlermeldungen schwer. Bevor wir das Cluster-Log anschauen wäre es einen Versuch wert, einen der beiden Knoten aus dem Cluster zu entfernen und wieder hinzuzufügen. Auch ist Deine Vermutung nicht ganz abwägig das, dass Storage System nicht sauber funktionieren könnte. Ich würde mal folgenden Ablauf vorschlagen:

    1. Führe mal eine Validation des Clusters durch - bringt der Report irgendwelche Warnungen oder Fehler
    2. Falls 1) zu keinen Ergebniss führt, probier mal einen kompletten Shutdown der Umgebung - wie von Dir vorgeschlagen
    3. Als letzte Option, alle VMs auf einen Knoten bringen und den anderen aus dem Cluster entfernen , neu starten und wieder in den Cluster aufnehmen

    Viele Grüße, Bernd Pfann [Microsoft] - This posting is provided "AS IS" with no warranties, and confers no rights.
    Donnerstag, 14. April 2011 20:54
    Moderator
  • Nabend Bernd,
    ich bin hingegangen und habe jetzt folgende Punkte durchgeführt:

    1. Cluster Volume offline geschaltet
    2. Cluster Validierungstest durchgeführt: Wurde _ohne_ Fehler abgeschlossen.
    3. Cluster Volume online geschaltet
    4. Beide Knoten heruntergefahren
    5. Storage abgeschaltet und wieder eingeschaltet
    6. Ersten Knoten hochgefahren
    Dieser Knoten hat es nicht geschafft die VMs zu starten, obwohl er Besitzer aller Volumes war.
    Es war dem Knoten auch nicht möglich auf das Cluster Volume zuzugreifen, obwohl in der Datenträgerverwaltung die Laufwerke als "OK" angezeigt wurden.
    Ich gehe also davon aus, dass dieser Knoten das Problem ist (macht).
    7. Zweiten Knoten hochgefahren, Cluster Volume auf den zweiten Knoten verschoben. VM's sind sofort hochgefahren.
    8. Den ersten Knoten entfernt und Rechner neugestartet.
    9. Knoten wieder hinzugefügt.


    Es ist mir nach wie vor nicht möglich mit diesem Knoten auf die Cluster Volumes zuzugreifen.

    Ich habe keine Ahnung woran das liegen kann,.. Was kann man noch tun? Knoten entfernen und iSCSI Verbindungen entfernen? Macht das überhaupt Sinn?

     

    Im Cluster Log habe ich unter anderem folgenden Fehler gefunden:

    Das freigegebene Clustervolume "Volume2" ("Storage") ist auf dem Knoten aufgrund von "STATUS_BAD_NETWORK_PATH(c00000be)" nicht mehr verfügbar. Alle E/A-Aktivitäten werden vorübergehend in eine Warteschlange aufgenommen, bis wieder ein Pfad zum Volume eingerichtet ist.

     

    Bin für jeden Tipp dankbar!


    Freitag, 15. April 2011 22:13
  • Yep, der eine Knoten scheint keinen Zugriff mehr auf den iSCSI Storage mehr zu haben und läuft deswegen nur mit redirected I/O. Das kann mehrere Gründe haben:

    1. IP-Problem
    2. Der Target kann nicht auf das konfigurierte Device zugreifen (also Storage)
    3. MPIO zickt rum

    Kannst Du mal schauen ob ein Ping sauber durch geht? Ich nehme an, dass Du zwei Verbindungen in das iSCSI Storage pro Knoten hast, einfach dabei immer die eine abziehen und schauen ob der Ping in der anderen geht. Schick auch mal einen IP-Config /all von allen Knoten und die IP vom Storage System.

    Siehst Du darüber hinaus einen Login auf dem iSCSI Storage von Knoten mit den Problemen .... sollte von allen Nodes vorhanden sein.

    Zuletzt schau mal in den iSCSI Initiator rein, steht der auf "connected" oder "reconnecting"?


    Viele Grüße, Bernd Pfann [Microsoft] - This posting is provided "AS IS" with no warranties, and confers no rights.
    Samstag, 16. April 2011 15:12
    Moderator
  • So, hab es hinbekommen.

    Problem war: Der "Client für Microsoft Netzwerke" und "Datei- und Druckerfreigabe" waren auf dem ersten Node auf der Netzwerkkarte für den Cluster intern Betrieb deaktiviert.
    Das wird wohl (warum auch immer) durch den Absturz des Systems verursacht wurden sein?

    Aber noch zu den Punkten von Bernd:
    IP Problem war es dann wohl nicht direkt, mehr ein "Client" Problem?
    Habe 4 Verbindungen pro Node zum Storage.
    iSCSI Initiator hat auch alles als connected angezeigt.

     

     

    • Als Antwort markiert PascalMeger Dienstag, 19. April 2011 18:29
    • Tag als Antwort aufgehoben PascalMeger Dienstag, 19. April 2011 18:55
    • Als Antwort markiert PascalMeger Dienstag, 19. April 2011 18:55
    Dienstag, 19. April 2011 18:29
  • Hallo Pascal

    Schön, dass Du den Fehler selbst gefunden hast. Das sich der Client durch einen Absturz auf dem internen Network deaktiviert habe ich noch nicht gesehen. Diesen zu deaktivieren war eine Empfehlung für Windows 2003 Cluster - könnte es hier nicht sein, dass jemand mit "alten" KnowHow am System war?

    Anyway, freut mich das der Cluster wieder läuft.

    !!! frohe Ostern !!!


    Viele Grüße, Bernd Pfann [Microsoft] - This posting is provided "AS IS" with no warranties, and confers no rights.
    Mittwoch, 20. April 2011 13:36
    Moderator
  • Kann ich mir ehr nicht vorstellen, mit Server 2003 hatten wir noch keine Cluster.
    Aber seltsam finde ich das auch.

    Donnerstag, 21. April 2011 07:33