none
Hyper-V R2 - mrznoucí síťovky u hostovaných OS

    Dotaz

  • Zdravím,

    nesetkal se někdo z Vás poslední dobou s problémem, kdy u jedné konkrétní virtuální mašiny přestane v neurčitých intervalech odpovídat síťovka? Restart to vyřeší.

    Konkrétní dvě konfigurace:

    1. Hyper-V server s Windows 2008 R2 Enterprise instalovaný jako Full (ne core), čtyři síťovky a na něm jako host RODC domain kontroler s Windows 2008 R2 Core s dedikovanou síťovkou. Běží to na HP ML370 G6, 1xE5630, 12 GB RAM s deseti disky 146 GB a jednou čtyřportovou síťovkou QLogic. Je zajímavý, že ostatní virtuály hostované na tomto Hyper-V serveru běží bez problémů

    2. Hyper-V server s Windows 2008 R2 Enterprise instalovaný jako Core, šest síťovek a na něm Windows Server 2008 R2 Standard full s Threat Management Gateway 2010 + Exchange Edge transportem a Forefront for Exchange. TMG má dedikované tři síťovky. Běží to na HP DL380 G7, 1xE5630, 24 GB RAM, osm disků 146 GB, dvě dualport síťovky Broadcom, dvě single port síťovky Broadcom. Na serveru běží ještě jeden virtuál, který je shodně jako v prvním případě v pořádku a nemá problémy.

    Frekvence toho vytuhnutí je nahodilá (týden, dva, klidně i tři), čas je nahodilý (ráno, v poledne, v noci). Když se na ten hypervisor podívám, tak virtual je running, já se na něj normálně přihlásím a můžu ho klasickým způsobem restartovat. Po restartu najednou začne komunikovat jakoby se nechumelilo.

    Podobný případ jsem zaznamenal u server 2003 R2, který byl hostovaný pod VMWare ESXi serverem 4.

    Tipuju, že to bude problém v implementaci ovladače virtuální síťovky, nebo obecně v síťové části Windows pokud jsou hostovány virtuálně. Nicméně žádné KB jsem k tomu nenašel vyjma tohoto: http://support.microsoft.com/kb/2223005 , což ale popisuje Windows Server 2003 a na Hyper-V. Nicméně v mém případě se to chová  trošku jinak. Věděli byste co s tím?

    pátek 31. prosince 2010 10:50

Odpovědi

Všechny reakce

  • Ahoj,

    podívej se sem...

    http://social.technet.microsoft.com/Forums/cs-CZ/virtualizationcs/thread/ff00efc3-01b5-4816-8c7d-813e617fac15

    a hlavně na tuto část..:

    In the Advanced tab, find the IPv4 Large Send Offload setting, and select Disabled from the drop-down list.

    pak napiš, jestli to pomohlo.

    sobota 1. ledna 2011 17:27
  • Je to sice rok a něco, ale je dobré na to odpovědět, neb tento problém se může vyskytnout i dalším lidem.

    Ten Offloading je jedna věc,ale ta pomáhá spíš na kartách firmy Broadcom (nic úředního, jen zkušenost). Nicméně tahle konkrétní záležitost byla způsobena kartou Qlogic, konkrétně NetXen p3p. Do téhle skupiny patří karty buď čtyřportové, nebo desetigigabitové od Qlogicu dodávané do serverů v podobě externích karet. (v mém případě nc375T, nc522SFP+). Obecně to jsou hodně nepovedené karty z hlediska spolehlivosti a hlavně s problémy pod Hyper-V když je použit HP Teaming. (mimochodem i s VMWarem jeden čas dost krutě bojovaly)

    V tom případě, který jsem řešil minulý rok pomohl Windows Update a aplikace posledních patchů pro Hyper-V a od té doby je klid. Nicméně podobný problém řeším aktuálně na Failover clusteru a to už tak super není. Prostě jednou za čas (cca po měsíci, či dvou) dojde ke krátkodobému výpadku na samotné kartě a vypadne buď jeden port, nebo celá karta. Výsledkem je resetování celého adaptéru (to se provede samo a za cca 30s), pokud se ovšem hypervisor nerestartuje delší dobu (víc jak ten měsíc), pak dojde k tomu, že karta padne úplně a musí se restartovat celý hypervisor. Zřejmně to má souvislost i s použitým teaming modem, kdy se v tomto konkrétním případě používá dynamic lacp a je to nastaveno i na switchích (které to tak za půlrok nevydrží a začnou padat taky). U mě bude řešení výměna těch karet za novější revize, které tuhle lahůdku už snad mít nebudou.

    Každopádně pokud shrnu: NetXen karty v Hyper-V asi nejsou úplně to pravé (zvlášť u teamingu). Je zajímavé, že na Intelech a Broadcomech při naprosto identické konfiguraci žádné problémy nejsou a všechno funguje jak víno (i v tom clusteru).

    úterý 3. dubna 2012 16:16