Fragensteller
Hyper V Server 2012 ESENT Warnungen und Performance Probleme

Allgemeine Diskussion
-
Hallo Community,
ich habe ein Problem auf einem unserer Hyper-V Server.
Erst einmal die technischen Daten:
Intel Hostsystem mit 64GB RAM und 2 Intel E5-2680
Intel RAID-Controller mit 5 Seagate 900GB HDDs
SCSI Controller zum Anschluss eines LTO Bandlaufwerks
Darauf läuft ein Server 2012 mit installierter Hyper V Rolle.
Bei den Gastsystemen (hauptsächlich DC und SQL) habe ich nun in unregelmäßigen Abständen, Fehlermeldungen im Eventlog,
die wie folgt aussehen:
Warnung 08.09.2013 01:29:56 ESENT 910 Systemleistung
svchost (3044) Der Wartungstask für die Datenbankcachegröße wurde 60 Sekunden ausgeführt, jedoch nicht abgeschlossen. Dies kann zu einer erheblichen Leistungsverringerung führen. Die aktuelle Cachegröße beträgt 2 Puffer mehr als das konfigurierte Cachelimit (200 Prozent der Zielvorgabe). Bei der Wartung der Cachegröße wurden 0 Puffer entfernt, 0 Versuche zum Leeren unternommen und 0 Puffer erfolgreich geleert. Der Vorgang wurde seit dem Start der Wartung 7659 Mal ausgeführt.^^
Warnung 08.09.2013 01:29:56 ESENT 910 Systemleistung
lsass (604) Der Wartungstask für die Datenbankcachegröße wurde 60 Sekunden ausgeführt, jedoch nicht abgeschlossen. Dies kann zu einer erheblichen Leistungsverringerung führen. Die aktuelle Cachegröße beträgt 21 Puffer mehr als das konfigurierte Cachelimit (131 Prozent der Zielvorgabe). Bei der Wartung der Cachegröße wurden 1 Puffer entfernt, 3828 Versuche zum Leeren unternommen und 0 Puffer erfolgreich geleert. Der Vorgang wurde seit dem Start der Wartung 15289 Mal ausgeführt.
Warnung 08.09.2013 01:30:24 ESENT 508 Systemleistung
svchost (3044) Eine Anforderung, in die Datei "C:\Windows\system32\LogFiles\Sum\Current.mdb" ab Offset 315392 (0x000000000004d000) insgesamt 4096 (0x00001000) Bytes zu schreiben, war erfolgreich, benötigte aber ungewöhnlich viel Zeit (304 Sekunden) von Seiten des Betriebssystems. Dieses Problem ist vermutlich durch fehlerhafte Hardware bedingt. Wenden Sie sich für weitere Unterstützung bei der Diagnose des Problems an Ihren Hardwarehersteller.
Die ID des svchost habe ich Diensten zuordnen können, hierbei handelt es sich um folgende:
- Hyper-V-Volumenschattenkopie-Anforderer
- Hyper-V-Dienst zu Herunterfahren
- Hyper-V-Datenaustausch
- Anschlussumleitung für Remotedesktopdienst im Benutzermodus
- Dienst für Benutzerzugriffsprotokollierung
Problem an der Sache ist, dass wenn diese Fehlermeldungen auftreten, oft kein Zugriff mehr auf SQL möglich ist.
Aller Treiber und Firmware habe ich bereits auf den neuesten Stand gebracht.
Ich hoffe jemand kann mir behilflich sein.
Besten Dank
Thorsten
PS. Wer mehr Informationen zur Hardware etc. benötigt, kann diese gerne haben. ;)- Typ geändert Raul TalmaciuMicrosoft contingent staff Mittwoch, 18. September 2013 07:05 Warten auf Feedback
Alle Antworten
-
Wie viel IOPS schafft Dein Storage-Subsystem? Sind hier die optimalen Parameter und Cache-Algorithmen konfiguriert (Stichwort: Write-Back/Read-Ahead Ratio)?
Wie viele VMs laufen pro LUN?
Wie viel RAM hast Du jeweils den VMs zugeordnet (Stichwort: Overcommitment)?
Es sieht so aus, als ob Dein Host-Storage nicht mit den Anforderungen Deiner VMs nachkommt.. eines der vernachlässigten Hauptprobleme bei der Virtualisierung.
--
Tobias RedelbergerStarNET Services (HomeOffice)Frankfurter Allee 193D-10365 BerlinTel: +49 (30) 86 87 02 678Mobil: +49 (163) 84 74 421 -
Guten Morgen,
ich kann dir ehrlich nicht sagen, wieviele IOPS der Host schafft, es sind neueste Constellation verbaut . Wir haben sehr ähnliche Systeme bei anderen Kunden aber problemlos im Einsatz.
Der Raid-Controller und somit die HDDs sind auf Write-Back konfiguiert (mit BBU)
Auf dem einen RAID 5 laufen 4 virtuelle Maschinen.
DC dynamischer RAM von 1-4GB
Mail statischer RAM 10GB
SQL statischer RAM 10GB
Terminal dyn. 1-10GB
Es arbeiten ca. 10 Personen mit diesem System. Ich würde dir zustimmen, dass der Host unterdimensioniert ist, wenn der Fehler regelmäßig,
bei Belastung auftreten würde. Allerdings passiert das auch mitten in der Nacht und da arbeitet dann niemand. Manchmal passiert auch tage lang nichts.
Danke und schönen Gruß
Thorsten
-
Läuft zu dieser Zeit evtl. ein Backup oder ähnlich IO-lastige Prozesse in einer VM oder auf dem Host?
Wenn Du das Problem nachstellen kannst, wird einmal den Performance-Monitor auf dem Host an und verifiziere die Ergebnisse.
S.a.:
Measuring Disk Latency with Windows Performance Monitor (Perfmon)
http://blogs.technet.com/b/askcore/archive/2012/02/07/measuring-disk-latency-with-windows-performance-monitor-perfmon.aspxWindows Performance Monitor Disk Counters Explained
http://blogs.technet.com/b/askcore/archive/2012/03/16/windows-performance-monitor-disk-counters-explained.aspxMeasuring Performance on Hyper-V
http://msdn.microsoft.com/en-us/library/cc768535.aspxOptimizing Performance on Hyper-V
http://msdn.microsoft.com/en-us/library/cc768529.aspx
- bzw. -
http://msdn.microsoft.com/en-us/library/dd722835.aspx--
Tobias RedelbergerStarNET Services (HomeOffice)Frankfurter Allee 193D-10365 BerlinTel: +49 (30) 86 87 02 678Mobil: +49 (163) 84 74 421 -
Also Backup hab ich extra abgeschaltet um das auszuschließen. Andere Tasks hab ich nicht geplant. Die Uhrzeit zu der die Fehler auftreten, variiert auch. Manchmal passiert Tage lang nichts.
Danke für die Links. Ich werde mich da mal durcharbeiten.
Gruß
Thorsten
-
Hallo,
bist Du hier weitergekommen?
Gruss,
RaulRaul Talmaciu, MICROSOFT
Bitte haben Sie Verständnis dafür, dass im Rahmen dieses Forums, welches auf dem Community-Prinzip „IT-Pros helfen IT-Pros“ beruht, kein technischer Support geleistet werden kann oder sonst welche garantierten Maßnahmen seitens Microsoft zugesichert werden können. -
Hallo,
nein nicht wirklich, außer das heute der virtuelle DC ausgefallen ist und sich nicht mehr booten lässt. :(
Aufgefallen ist uns allerdings, dass die Schreib und Lesegeschwindigkeit des RAID sehr langsam ist.
Muss jetzt erstmal versuchen den DC zu retten.Gruß,
Thorsten
-
Dann verifizierte einmal den RAID-Controller inkl. sämtlicher Festplatten.
Hierzu ziehe das Handbuch oder den Support des jeweiligen Herstellers hinzu.
Wie gesagt, dein Storage-Subsystem geht schon länger die Puste aus - wieso? Das herauszufinden liegt nun an Dir..
--
Tobias RedelbergerStarNET Services (HomeOffice)Frankfurter Allee 193D-10365 BerlinTel: +49 (30) 86 87 02 678Mobil: +49 (163) 84 74 421 -
Hallo Thorsten,
Hast du die Tipps ausprobiert? Bist Du weitergekommen?
Viele Grüße,
AlexAlex Pitulice, MICROSOFT
Bitte haben Sie Verständnis dafür, dass im Rahmen dieses Forums, welches auf dem Community-Prinzip „IT-Pros helfen IT-Pros“ beruht, kein technischer Support geleistet werden kann oder sonst welche garantierten Maßnahmen seitens Microsoft zugesichert werden können. -
Hallo Alex,
ich habe alles möglich gemessen. Mein Problem ist weiterhin, dass die Leistung des RAID 5 einbricht.
Beispiel: Ich kopiere eine 50GB Testdatei. Anfangs liegt die Geschwindigkeit ca 350mb/s, nach 1-2 Minuten sinkt diese auf teilweise unter 5mb/s.
Noch hab ich also keine Lösung.
Viele Grüße
Thorsten
-
Was sagt der Hersteller-Support dazu..?
Neueste Firmware (Controller und Festplatten) und Treiber installiert?
--
Tobias RedelbergerStarNET Services (HomeOffice)Frankfurter Allee 193D-10365 BerlinTel: +49 (30) 86 87 02 678Mobil: +49 (163) 84 74 421 -
Hallo Thorsten,
hast Du in der Zwischenzeit die Ursache des Problems vielleicht gefunden?
Gruss,
Alex
Alex Pitulice, MICROSOFT
Bitte haben Sie Verständnis dafür, dass im Rahmen dieses Forums, welches auf dem Community-Prinzip „IT-Pros helfen IT-Pros“ beruht, kein technischer Support geleistet werden kann oder sonst welche garantierten Maßnahmen seitens Microsoft zugesichert werden können. -
Hallo Thorsten
Ich stehe momentan vor dem selben Problem.
Die Hardware ist sehr ähnllich.
HP Proliant DL380p Gen8
RAID 5 mit 3x 900 GB 10 K SAS Platten
32 GB RAM
Windows 2012 (kein R2) mit Hyper-V Dienst
Windows 2012 als virtueller DC
Dieser DC zeigt das identische Problem wie du beschreibts.
Pro Tag meherer Minuten keine Response auf nichts und die Event-Einträge wie du sie beschreibst.
Hast du zwischenzeitlich eine Lösung?
Besten Dank
Christoph
-
Das Problem bei mir ist gelöst.
Ursache war bei mir der aktivierte Volumeschattenkopie Dienst auf dem Hyper-V Host und zwar auf der Partition, auf welcher die virtuelle Harddisk des DCs lag.
Nach dem Deaktivieren des Volumeschattenkopie Dienstes kam der Event ID 910 etc. auf dem virtuellen DC nie mehr.
Es ist einleutend, dass das Erstellen einer Volumeschattenkopie von riesigen virtueller Harddisk-Files enorm IO produziert und der virtuelle Server in dieser Zeit kurzzeitig einfrieren und alle seine Dienste vorübergehend einstellen kann.
Christoph