none
VMQ in Windows 2012 R2 - Probleme neu aufgewärmt? RRS feed

  • Frage

  • Hi,

    obwohl es die letzten Monate recht ruhig um das VMQ Feature geworden ist (Dank Intel NIC Updates), kochen seit ein paar

    Wochen die Probleme wieder etwas auf.

    Auf Windows 2012 R2 Server mit HYPER-V Rolle und VMs gibt es sporadisch immer harte Systemfehler, die dann in ein paar Stunden nach Auftreten zum Bluescreen oder sanften Einfrieren des Servers führen (also keine Reaktion mehr - nur noch hartes Reset bzw. Aus/Ein hilft). Da der Effekt auf mehreren System (fast 1:1 Konfig) auftritt, dürfte es sich nicht um Hardwareprobleme handeln es muss eher Software bedingt sein.

    Die Server Maschinen sind grob wie folgt ausgestattet: (TYAN MB)

    AMD Opteron - 2 Sockel mit entweder 6- oder 8 Keren CPU

    64 GB RAM ECC (entweder noch DDR2 oder auch DDDR3) - je nach Modell

    INTEL LAN onboard - 2 Port NIC 82575EB (plus 1 Port 82574L für Admin LAN) - keine VLAN Struktur, kein NIC Teaming

    INTEL X540-T1 bzw. T2 für die Anbindung des Storage (Windows 2012 Storage Server)

    Die Treiber sind alle "Intel" aktuell bzw. das was MS original mitgeliefert hat.

    Als VM Gäste laufen im Schnitt 8-12 VMs auf den Servern

    Fehlermeldung ist immer ähnlich (es wird :

    Failed to allocate VMQ for NIC 4BB15697-3C02-43CE-A64B-E2F1C7333A07--DF12EEE0-316A-4B8D-940D-CB0A502EBCF6 (Friendly Name: Netzwerkkarte) on switch A92BEDB1-7042-493A-BAF4-9F2FC76A3F8E (Friendly Name: LAN-intern). Reason - Maximum number of VMQs supported on the Protocol NIC is exceeded. Status = Nicht ausreichend Systemressourcen, um die API abzuschließen.

    Event-ID 113

    Quelle: Hyper-V-VmSwitch

    (siehe auch Bild)

    Effekt beim Auftreten:

    Prinzipiell treten die Fehler spontan und dann der Reihe nach bei allen LAN NICs auf. Davon bekommt man in den Gästen und auch die Nutzer im LAN nichts mit. Alles läuft erst mal so weiter wie gehabt.

    Nach einiger Zeit und dass kann dann Stunden oder 1-2 Tage (!) sein, friert der Server einfach so ein. Startet man das betreffende System wieder neu, läuft alles für 3-6 Wochen wieder OK bis der Fehler wieder auftritt.

    Wie ich herausgefunden habe, gab es mal 2012 mit Windows 2012 und Broadcom NICs ähnliche Probleme. Dazu gab es dann einen Hotfix vom MS. Broadcom NICS sind aber nicht im Einsatz.

    Die Windows 2012 R2 sind mit MS Updates fullfixed, keine weiteren Hotfixes.

    Was kann ich jetzt gegen diese Fehler tun?

    Danke für Eure Hilfe.


    Danke und liebe Grüße Oliver Richter

    Mittwoch, 12. März 2014 10:11

Antworten

  • Hallo Zusammen,

    VMQ ist ein leidiges Thema, was sich anscheinend Querbeet durch die NIC-Vendoren durchzieht. Sei es Broadcom, Emulex oder Intel. Ich empfehle mittlerweile VMQ zu deaktivieren, da es mehr Probleme verursacht als alles andere.


    Viele Grüße Daniel Neumann - This posting is provided "AS IS" with no warranties, and confers no rights.

    Sonntag, 16. März 2014 13:47

Alle Antworten

  • Hi,

    ich kann das mit Server 2012 R2 in einem Hyper-V Failovercluster bestätigen!

    Allerdings mit komplett anderer Hardware:

    Intel S2600GZ Dual Xeon E5-2630
    128GB DDR3
    8 Port Intel LAN I360

    Treiber von Intel sind aktuell.

    Microsoft NIC Teaming ist hier allerdings im Einsatz.

    Läuft die betroffene VM allerdings auf älterer Hardware treten diese Fehler nicht auf!

    Intel S5520URSAS E5520
    96GB RAM
    Intel LAN
    82575EB

    Gruß

    Sebastian


    • Bearbeitet SebVe Mittwoch, 12. März 2014 12:26
    Mittwoch, 12. März 2014 12:12
  • Hallo Zusammen,

    VMQ ist ein leidiges Thema, was sich anscheinend Querbeet durch die NIC-Vendoren durchzieht. Sei es Broadcom, Emulex oder Intel. Ich empfehle mittlerweile VMQ zu deaktivieren, da es mehr Probleme verursacht als alles andere.


    Viele Grüße Daniel Neumann - This posting is provided "AS IS" with no warranties, and confers no rights.

    Sonntag, 16. März 2014 13:47
  • Danke @alle!

    @ Raul,

    Naja "VMQ generell zu deaktivieren" als Lösung anzusehen kann ich nicht so recht nachvollziehen.

    Kommt ja dem gleich, wenn ich Probleme mit Servern habe, zukünftig keine Server mehr einzusetzen. Oder andersherum (mal etwas provokativ): Dann sollte MS VMQ gleich einstellen, wenn es eh besser ist es auszuschalten.

    Laufen denn die NIC Driver nicht bei MS den HWQL Test durch? Ich würde den NIC Vendoren hier mal kräftig auf die Finger klopfen! Es kann ja nicht sein, wenn ich auf 'nen Server 2-5 VMs hab, läuft VMQ OK, bei mehr dann nicht mehr (mal ganz flach verallgemeinert). Da macht dann Server Virtualisierung keinen Sinn, wenn ich nur in so kleinen Grenzen arbeiten könnte. Intel selbst lässt ja bei den "großen" Serveradaptern bis zu 63 VMQs zu (in Waage mit SRIOV) - also Sinn macht das ganz so für mich nicht.

    Also halte ich es wie der alte Bundeskanzler Kohl: Wir sitzen die Sache mal aus. Evtl. wird es in Windows 2014 ja besser. ;-)


    Danke und liebe Grüße Oliver Richter

    Montag, 24. März 2014 08:47
  • Hallo,

    in den Virtualisierungseinstellungen des Netzwerkadapters (im Gerätemanager) die VMQs erhöhen, dann ist der Fehler weg.

    LG Chris

    Mittwoch, 3. Juni 2015 17:23
  • Hallo @Chris,

    Danke für die Info. Nur dieses Features gibt es nicht bei allen Netzwerkkarten. Die Intel 575EB Serie kennt nur VMQ ein/aus. Aber OK bei den (meisten) neueren Modellen klappt das ;-)


    Danke und liebe Grüße Oliver Richter

    Montag, 8. Juni 2015 12:19
  • Hallo zusammen,

    auch wir haben Performance-Probleme und ich stoße immer wieder darauf das an der VMQ liegt.
    Wir haben 2 Hyper-V Hosts mit Server 2012 R2 Datacenter laufen und beide Hosts haben je 4 Intel I350 Gigabit NIC eingebaut.

    Kann ich die VMQ auf diesen NICs im laufenden Betrieb deaktivieren ohne das es hier zu Problemen kommt?
    Ist danach ein Neustart erforderlich etc.?

    Donnerstag, 14. Dezember 2017 13:56
  • Hallo @syliz_wp

    unser Fall aus 2015 ist schon ein wenig hinter uns. Bei den Intel I350 Karten hatten wir bisher keine schwerwiegenden Probleme mit VMQ. Das läuft eigentlich gut.

    Wichtig erscheinen mir nur aktuelle Intel Treiber und bei Installation die Funktionen für Virtualisierung mit aktivieren. Im Treiber selbst dann für die LAN Karte auf Nutzung für "Virtualisierung" stellen. Sofern man die Treiber nativ nutzt und kein Windows Teaming.

    Aus meiner Sicht viel wichtiger sind aber die korrekten Einstellungen für die LAN Karten und CPU Nutzung inkl. RSS.

    Prüfe hierzu mal die Event-Logs! Tauchen dort Fehler auf dann muss dies behoben werden.

    Windows hat leider keinen Automatismus, mit dem der Traffic der VM Switche über alle CPUs verteilt werden. Im ungünstigsten Fall läuft alles über CPU 0 / Core 0 und der hat eh schon Grundfunktionen von Windows zu stemmen. Bei viel Traffic sackt dann die Performance ab, bis hin zu Crashs.

    Sofern Du es noch nicht kennst oder getan hast...

    Bei Broadcom gibt es einen guten Artikel drüber, der auch grundlegend für Intel gilt:

    https://www.broadcom.com/support/knowledgebase/1211161326328/rss-and-vmq-tuning-on-windows-servers

    Oder hier reinsehen die Serie 1-3 Folgen:

    http://blogs.technet.com/b/networking/archive/2013/09/10/vmq-deep-dive-1-of-3.asp

    P.S. Die VMQs so richtig live ändern würde ich persönlich zuvor an einem Lab-System testen. Imho bricht evtl. kurz die LAN Verbindung ab, womit sich evtl. einige Anwendungen schon verhusten können. Ist die LAN Sache generell nicht optimal konfiguriert kann einem auch der komplette VM-Switch hängen bleiben. Dies ist dann in einem Live Produktivsystem kein guter Akt.


    Danke und liebe Grüße Oliver Richter

    Donnerstag, 14. Dezember 2017 14:21