none
DAG下的信箱資料庫不定時會變更裝載主機 RRS feed

  • 問題

  • 各位先進大家好,

    小弟的Exchange 2013 DAG環境最近發生了幾次資料庫突然變更裝載主機的現象,查看Event Log,發現在發生變更前,資料庫Log檔會出現一些錯誤,例如以下的一些事件,然後資料庫裝載就移到另一台主機,而過一段時間,資料庫又會再發生移轉,而移轉後本地資料庫會變成是被動資料庫,跟主要資料庫的同步也都成功,

    事件 509,ESE(ESE)
    Information Store - M01 (22880) M01: 要求從檔案 "D:\MailDB\DB01\M01.edb" 的位移 55885922304 (0x0000000d030f8000) 處讀取 229376 (0x00038000) 個位元組已成功,但 OS 使用了異常長的時間 (11 秒) 來處理。此外,自上封關於此問題的郵件於 257190 秒前公佈後,對此檔案的 5 個其他 I/O 要求也使用了異常長的時間。此問題可能歸因於硬體錯誤。請連絡您的硬體廠商,以取得診斷此問題的進一步協助

    事件 489,ESE(ESE)
    msexchangerepl (6592) 嘗試開啟唯讀存取權限檔案 "D:\MailDB\DB01\E01.log" 失敗,系統錯誤為 32 (0x00000020): "程序無法存取檔案,因為檔案正由另一個程序使用。 "。開啟檔案作業將失敗,錯誤為 -1032 (0xfffffbf8)。 

    事件 164,ExchangeStoreDB
    此伺服器上的 Exchange Store 資料庫 'M01' 副本在 '2017/7/5 上午 09:30:11' 時,在進行定期狀態檢查時逾時。如需更多關於此失敗的詳細資訊,請查閱伺服器上的其他儲存及 "ExchangeStoreDb" 事件的事件記錄檔。容錯移轉已成功還原服務。

    而信箱資料庫裝載主機的System Event Log也會產生大量的Schannel錯誤事件,幾乎每隔兩秒就發生一次,被動資料庫主機則不會有這錯誤:

    事件 36887,Schannel
    收到來自遠端端點的嚴重警示。TLS 通訊協定定義的嚴重警示代碼為 46。


    因為之前沒有這種現象,最近才開始發生,一開始懷疑是防毒或備份造成資料庫存取異常,但事後確認並沒有安裝防毒或備份軟體,也有懷疑Storage或網路不良還是記憶體不足等等,但檢查後也排除了這些因素,就不知還有甚麼原因,

    還請各位先進分享一下經驗,謝謝~

    John Jiang

    2017年7月10日 上午 07:24

所有回覆

  • TLS 46 的問題與 "憑證" 有關,請朝這方面的狀況檢查

    2017年7月10日 上午 07:37
  • 資料庫所在的磁碟是在本機伺服器的硬碟上,
    還是透過 iSCSI 掛進本機的磁碟?


    蘇老碎碎念
    資訊無涯,回頭已不見岸
    Facebook - 微軟台灣官方論壇愛好者俱樂部
    如何在論壇正確發問,請參考iThome的文章: 如何問到我要的答案

    2017年7月10日 上午 08:13
    版主
  • 謝謝;

    我的兩台Exchange 2013都採用VMware環境的虛擬機,資料庫磁碟對虛擬機而言是本機磁碟,但實際儲存位置位在FC SAN Storage環境內,兩台都配備16G記憶體,共有400個容量1GB的信箱,分散到4個資料庫上,有觀察日常CPU/Memory使用率都還好,從Hypervisor觀察CPU/Memory/Disk等效能指標也沒有不良狀況,系統上線三個月運作也都正常,最近才開始出現這問題。

    至於憑證問題因為Exchange架設時就有從CA更新憑證,憑證主體名稱或別名也都確認過是正確的,上線後OWA及Outlook使用也都正常,不知還有哪些憑證設定事項需要檢查,還請各位多指教,謝謝~

    John Jiang


    • 已編輯 glavinec 2017年7月10日 上午 09:03
    2017年7月10日 上午 09:02
  • 你好, 這樣的話原因可以有很多, 但DAG會把DB failover到其他DAG Node是一定有它的理由的

    這可能是因為備份時令主機出現過長的延時, 因為有些備份會先做Snapshot, 

    可能是網絡太擠擁令叢集Heart beat訊號過時

    也可能是大量的郵件積壓在Write Queue當中, 那當然, 不良的FC光纖令訊號掉封包也可以是問題所在

    總而言之DAG會用盡辦法在察覺有這些"小問題"出現時就嘗試令Active DB轉到其他地方

    問題的原因不能幫你查明, 但事件紀錄會記下時間, 把幾次發生的時間配合你們收集到的資料才能對應原因


    邊幫助, 邊鍛鍊

    2017年7月11日 上午 02:46
  • 您好,

    可能是硬碟有問題,或者該DB有損毀,才會造成此現象.

    另外,也有一種可能是,DAG伺服器的Windows Update及Exchange CU Update 不一致關係,

    也會導致此現象發生.

    提供您參考,

    希望對您有所幫助

    謝謝.

    2017年7月11日 上午 03:28