none
Hyper V架構上的Windows Server 網路卡介面時常斷線 RRS feed

  • 問題

  • 各位版上大神大家好

    小弟是公司IT新手,目前在管理exchange上遇到了很崩潰的狀況,目前還查找不到問題點,所以來版上求助各位大神...

    exchange環境:
    有兩台實體主機(暫且稱為server A、server B)在HP刀鋒伺服器上,採用hyper-V架構,是windows server 2016 & Exchange 2016 enterprise版,server A、B互相備援,dag主機及容錯叢集管理員設在server B上,

    網路環境:
    刀鋒伺服器是採用HP FlexFabric 10Gb 2-port 554FLB Adapter網卡,在主機裡面呈現6個網路介面卡,server A、B都各有兩張網路介面卡組成APnet-Team,小組模式是「交換器獨立」、採用「動態模式」,還有一張是heartbeat。

    目前問題如下:

    從4天前就開始發生容錯管理員認不到server A,檢查一下網路介面卡,當下是呈現啟用狀態,但server A ping不到 server B、gateway、網域主機,有傳送封包但皆遺失。
    剛開始遇到這問題時,想要重啟網路介面卡,但重啟後沒反應,後來決定重新開機便恢復正常,第一天維持半天之後又出現同樣情形、第二天大概3小時就會這樣,到現在只要大概90分鐘就會斷線...  雖然現在把服務皆指向server B,但資料庫複寫的部分實在無法容忍server A一直離線....

    處理狀況跟已經排除的原因如下:

    1.這樣的情況發生好幾次後,覺得最快最直覺的方法就是重開機 (小弟知道重開機對server不好)
    但因為情況發生後,有幾次停用網路卡之後就啟用不了,甚至有幾次是連停用都停用不了,server也會漸漸變成當機情形(但有檢視cpu效能,沒有發現異常耗效能或異常服務出現)。

    2.已經有請刀鋒伺服器的廠商來更換過網卡、網路線,但都沒有改善 (ping不到 server B、gateway、網域主機),所以暫時排除這些問題,但因為刀鋒伺服器老舊,小弟的同事認為可能實體網路還是有問題,只是廠商沒查找出來...

    3.小弟認為可能作業系統已有損壞,有簡單詢問過微軟大師,大師建議是走災後復原,但因為怕實體網路真的有問題,走災後復原工程有些浩大,也害怕網路沒解決,問題仍然出現,所以遲遲沒有動手...

    4.有看過伺服器管理員上的log及事件檢視器,除了serverA離線後所產生的各種資料庫複寫被迫停止、LDAP查詢異常、與AD網域連線失敗等錯誤訊息,沒有找到甚麼特別的事件QQ


    不知道版上的大神是否可以給小弟一盞明燈,或是哪裡可能可以找到問題的所在,小弟偶本人已經瀕臨崩潰中....
    先在此謝謝大家!



    (小弟第一次在板上發問,若有不妥的地方請大家多多指教)
    2020年10月15日 上午 07:07

所有回覆

  • 您好,

    我認為應該是HP刀鋒上的Switch故障造成的.

    通常刀鋒會有二片Switch配置HA,有可能一片故障導致網路中斷.

    需要調整一片Switch來運作試試...

    提供您參考,

    希望對您有所幫助,

    謝謝.

    2020年10月16日 上午 03:07
  • 謝謝Mark 大大!
    趕快來查看看是不是switch的問題

    另外還有個奇怪的點是 因為server上有很多刀,但只有其中一刀會有那個情形,所以廠商好像一直都不認為是硬體的問題QQ

    再次感謝Mark的回覆~~~ 

    2020年10月19日 上午 03:19
  • 您好,

    就因為刀鋒的Switch有兩片有作HA,若其中一片Switch故障或是Switch Port壞掉,

    都會造成刀鋒運作不正常又或者發生只有某幾刀會有斷線情形.

    這問題,因為我之前遇到過,所以,

    提供您參考,

    希望對您有所幫助,

    謝謝.


    2020年10月20日 上午 12:51