none
Hyper-V-FailoverCluster macht Probleme bei Snapshots und Livemigration RRS feed

  • Frage

  • Hallo,

    ich habe einen 2-Knoten Failover- Cluster mittels Server 2019 Std gebaut.
    Ein per SAS angeschlossenes Storage stellt uns verschiedene Volumes bereit.
    Die konfigurierten Rollen sind Hyper-V (auf Cluster Shared Volume) und Fileserver (als Dateiserver zur allgemeinen Verwendung auf einen shared Volume).

    Die Netzwerkkarten sind folgendermaßen gewählt:
    - 2x 1GB NICs als Team für die ausschließliche Clusterkommunikation
    - 2x 1GB NICs als Team für Management und Clientzugriff 
    - 2x 10GB NICs für die vMs (ohne Verwendung für das Hostsystem)

    Die Replikation authentifiziert sich mittels Kerberos und läuft mit Komprimierung.
    Beide Cluster Knoten sind Mitglied des AD eines noch vorhandenen SBS2011 und ich bin als Dom-Admin angemeldet.
    Zu erwähnen wäre noch, dass ich fast alle vMs von einem Single Hyper-V Host unter Server 2012R2 auf den aktuellen Cluster verschoben habe (mittels SMB!) und die Version hochgestuft habe.

    Die Sicherung der vMs mache ich mit Veeam B&R.
    Jedes Mal, wenn eine vM gesichert wird, erstellt der Hypervisor einen Snapshot und somit eine avhdx Datei.
    Sobald Veeam sein Backup beendet hat gibt es Signal an Hyper-V zum Konsolidieren der Festplatten.
    Nur Hyper-V tut das nicht!
    Alle gesicherten vMs laufen noch auf den diff. Platten.

    Das große Problem an dieser Stelle ist, dass ich keine Verschiebung auf den anderen Host mehr machen kann, er bricht eine Livemigration folgendem Fehler ab:
    „Die ausstehende Verschiebung für die Rolle "vM1" konnte nicht abgeschlossen werden.“ ab. Resource Control Manager ID 1155.

    Eine Schnellmigration wird mit folgenden Fehlern beendet:
    „Fehler in der Clusterressource "Konfiguration des virtuellen Computers "vM1"" des Typs "Virtual Machine Configuration" in der Clusterrolle "vM1". Fehlercode: "0x569" ("Anmeldung fehlgeschlagen: Der Benutzer besitzt nicht den benötigten Anmeldetyp auf diesem Computer.")

    Abhängig von den Fehlerrichtlinien für die Ressource und die Rolle wird vom Clusterdienst möglicherweise versucht, die Ressource auf diesem Knoten online zu schalten oder die Gruppe auf einen anderen Knoten des Clusters zu verschieben und die Ressource dann neu zu starten. Prüfen Sie den Ressourcen- und Gruppenzustand mit dem Failovercluster-Manager oder mit dem Windows PowerShell-Cmdlet "Get-ClusterResource". Resource Control Manager ID 1069.
    Und 
    „Der Clusterdienst konnte die Clusterrolle "vM1" nicht vollständig online oder offline schalten. Möglicherweise befindet sich mindestens eine Ressource in einem fehlerhaften Zustand. Dies kann sich auf die Verfügbarkeit der Clusterrolle auswirken.“ Resource Control Manager ID 1205.
    Die Maschine bleib dann natürlich in fehlerhaftem Zustand.

    Nachdem der Versuch zum Verschieben fehlgeschlagen ist kann ich auch keinen Prüfpunkt (Produktiv) mehr manuell erstellen:
    Von vM1 konnte kein Prüfpunkt erstellt werden. Der Vorgang kann nicht ausgeführt werden, während das Objekt verwendet wird.“
    Vor dem Versuch konnte der Prüfpunkt noch manuell erstellt werden…!

    Eine Überprüfung des Clusters bringt keinerlei Warnungen oder Fehler!

    Ich bin mir nicht sicher, ob das Problem mit der Konsolidierung oder das Problem mit dem Verschieben der vM der Ursprungsfehler ist.
    Nach einem Reboot des Hosts konsolidiert er wieder die Platten und das Ganze System ist zunächst wieder ok. Auch ein Verschieben ist dann wieder problemlos möglich.
    Ab und zu hilft auch ein Neustart des vmms Dienstes!

    In einem Bericht habe ich gelesen, dass dies geschieht wenn ein Backup und eine Replikation gleichzeitig laufen:
    https://charbelnemnom.com/2016/03/background-disk-merge-failed-to-complete-the-requested-operation-could-not-be-completed-due-to-a-file-system-limitation-0x80070299-hyperv/
    Ist eigentlich nicht der Fall!

    Ich hoffe jemand kann mir hierbei Hilfestellung geben...

    Viele Grüße Thomas 

    Donnerstag, 12. September 2019 09:37