none
[求救] Windows Server 2003 的"Delayed Write Failed"問題 RRS feed

  • 一般討論

  • 各位大大, 本人工作的公司伺服器自14 MAY 2009開始, 不停出現"Delayed Write Failed"的警示, 更導致伺服器多次緩慢的當機, 無法正常運作, 現本人提供相關資料, 希望各位大大可以幫本人知道解決問題的方向, 謝謝!!

    Hardware:
    HP Proliant ML110 G2 Tower Server
    P4 3.0 (1MB cache)
    512MB PC3200 ECC Non_Buffered CL-3 DDR RAM (2x 256MB)
    1x LAN port (100MBps, Driver: intel PRO/1000 MT network connection)
    2x 80GB Maxtor SATA 100 (SATA1) hdd
    1x SATA RAID card: Promise FastTrak TX2200

    運行著 hardware RAID 1, 故在Server OS內只看見硬盤為"Promise 1x2 Mirror/ RAID1 SCSI Disk Device" (Driver Version: 5.2.3790.0  1 OCT 2002)

    OS: Windows Server 2003 Standard SP2 English

    Software: Symantec AntiVirus Corporate 9.0
    Promise Array Management (14 APR 2009後安裝, Useless)
    Unlocker (14 APR 2009後安裝, Uesless)
    ERUNT (Registry Backup Program, 14 APR 2009後安裝)
    Windows Defender
    Windows PowerShell 1.0

    硬盤規劃: 有兩個組間, 以C:\為OS區(包括Domain, DNS, Active Directory), E:\為檔案伺服器區

    IP: 已設固定IP, 伺服器沒有安裝DHCP

    公司網絡環境: 有一個叫Linksys SR224 24 ports的Switch(交換器), 有23 ports 已插線, 平均有15-19 ports在活動), 所有公司的電腦和ISP的modem都接駁著這個switch,  而我們平時上網瀏覽外面的網站時, 都會從24 ports Switch再經由ISP提供的Linksys 4 ports switch, 然後再接上modem才可... 另外, 我公司現在有3部使用Windows XP Home的自組機, 9 部使用Windows Vista Business English的HP 電腦, 1部Mac OS X...

    故障現象:
    1. 大多數出現在E:\, 由其他的Vista電腦網路遙距開啟一段時間並進行修改後貯存, 或直接另存本機檔案於伺服器內, 便會出現"Delayed Write Failed", 反而Xp電腦甚少出現這樣情況
    2. 多數以Microsoft Office (WORD, EXCEL)檔案(包括.TMP), 和以".JPG"檔案為主
    3. 也有複製大容量的檔案至伺服器時出現問題, 包括".PDF"和".JPG"
    4. 曾在15 OCT 2008及16 APR 2009出現過"Delayed Write Failed", 以16 APR 2009的情況嚴重, 本人須停止伺服器進行維修檢查, 方法容後補充
     5. 於14 MAY 2009出現的錯誤, 本人曾多次停止伺服器, 更換主機版(原本的那塊已經有兩顆電容器爆溢)及加裝系統文件和登錄碼, 修改內存容量, 安裝Hotfix等, 但還是出現同一問題, 方法容後補充
    6.  於16 APR 2009的事件, 本人曾經另存事件檢視器至C:\, 但也出現同樣錯誤
     就算Microsoft Office已關掉也好, 伺服器也經常出現錯誤訊息導致當機...

    曾處理方法:
    16 APR 2009 - 用其他電腦連接兩個硬盤, 抄走有問題的檔案, 用HD Tune檢查兩個硬盤有否壞磁軌, 檢查為沒發現, 並於18 APR 2009進行Windows Updates, 但並非所有hotfix都使用

    14 MAY 2009 - 用其他電腦連接兩個硬盤, 抄走有問題的檔案, 用HD Tune檢查兩個硬盤有否壞磁軌, 檢查為沒發現
    15 MAY 2009 - 致電電腦公司, 更換主機版
    16 MAY 2009 - 嘗試重新啟動Linksys SR224
    19 MAY 2009 - 用其他電腦連接兩個硬盤, 用HD Tune檢查兩個硬盤有否壞磁軌及檢視SMART數據, 檢查為沒發現
    14 MAY 2009至25 MAY 2009 - 不停為OS加裝系統文件和登錄碼, 修改內存容量, 安裝Hotfix等(見參考連結)
    16 MAY 2009 + 22 MAY 2009 - Windows 2003 自行進行Scandisk檢查, 修正了E:\部份文件, 但事後檢查均沒有發現遺失檔案

    現時情況: 暫未出現"Delayed Write Failed"的訊息彈出

    其他:
    22 MAY 2009 - 監察同事貯存EXCEL檔案至伺服器內, 這檔案導致同樣問題, 但貯存失敗, 而伺服器同一時間曾經當機...
    25 MAY 2009 - 發現出現"Delayed Write Error" 錯誤之同時間, 出現Indexing error... (請見錯誤報告 Event ID 4124)
    25 MAY 2009 - 已儲起所有相關紀錄, 另已用Microsoft Product Support Report, 可向本人查詢索取...

    錯誤報告內容:

    Event Type: Information
    Event Source: Application Popup
    Event Category: None
    Event ID: 26
    Date:  5/21/2009
    Time:  11:47:46 AM
    User:  N/A
    Computer: SERVER
    Description:
    Application popup: Windows - Delayed Write Failed : Windows was unable to save all the data for the file E:\PATH\FILE. The data has been lost. This error may be caused by a failure of your computer hardware or network connection. Please try to save this file elsewhere.
    For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.

    Event Type: Warning
    Event Source: Ntfs
    Event Category: None
    Event ID: 50
    Date:  5/21/2009
    Time:  11:47:46 AM
    User:  N/A
    Computer: SERVER
    Description:
    {Delayed Write Failed} Windows was unable to save all the data for the file . The data has been lost. This error may be caused by a failure of your computer hardware or network connection. Please try to save this file elsewhere.
    For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
    Data:
    0000: 04 00 04 00 02 00 52 00   ......R.
    0008: 00 00 00 00 32 00 04 80   ....2..€
    0010: 00 00 00 00 15 00 00 c0   .......À
    0018: 00 00 00 00 00 00 00 00   ........
    0020: 00 00 00 00 00 00 00 00   ........
    0028: 15 00 00 c0               ...À   

    Data (Word):
    0000: 00040004 00520002 00000000 80040032
    0010: 00000000 c0000015 00000000 00000000
    0020: 00000000 00000000 c0000015

    Event Type: Error
    Event Source: Ci
    Event Category: CI Service
    Event ID: 4124
    Date:  5/22/2009
    Time:  6:26:01 PM
    User:  N/A
    Computer: SERVER
    Description:
    Content index on c:\system volume information\catalog.wci is corrupt. Please shutdown and restart the Indexing Service (cisvc).
    For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.

    參考連結:
    http://support.microsoft.com/kb/969352/en-us

    http://support.microsoft.com/kb/949123/en-us

    http://support.microsoft.com/kb/812937/en-us

    http://support.microsoft.com/kb/296264/en-us

    http://support.microsoft.com/kb/818408/en-us

    http://support.microsoft.com/kb/330174/en-us

    http://support.microsoft.com/kb/816004/en-us

    http://support.microsoft.com/kb/843515/en-us

    http://www.hkitn.com/print.php/2750

    http://www.gibni.com/windows-delayed-write-failed-solved

    http://www.gibni.com/windows-delayed-write-failed-solved/2 (Max128k filter)

    http://www.gibni.com/windows-delayed-write-failed-2 (Cacheset)

    http://articles.techrepublic.com.com/5100-10878_11-5032895.html

    • 已編輯 Ronin_KahO 2009年7月10日 上午 07:05
    2009年5月25日 上午 07:56

所有回覆

  • 有用記憶體檢測軟體測試過記憶體嗎?
    另外,有考慮移除防毒軟體後觀察情況嗎?


    蘇老碎碎念
    資訊無涯,回頭已不見岸
    2009年5月25日 上午 08:26
    版主
  • 現在我暫停了Symantec AntiVirus所有Service去做檢測中...
    2009年5月25日 上午 08:27
  • 證實了暫停了Symantec AntiVirus之後都會出現"Delayed Write Failed"
    2009年5月25日 上午 08:56
  • 是暫停了之後會依舊出現還是不會出現?
    如果依舊出現,建議完整移除防毒軟體後再觀察一次。
    蘇老碎碎念
    資訊無涯,回頭已不見岸
    2009年5月25日 上午 09:16
    版主
  • 嘩, 這是好困難的咧...
    我只可以在星期二, 四, 六才可以回公司去試去修...
    公司這麼規定, 我拿它沒輒...
    2009年5月25日 上午 09:17
  • 各位大大, 我公司伺服器的Delayed Write Failed問題, 一直以來都沒有辦法根治, 只是到最後用chkdsk去掃瞄硬盤(不檢查壞磁區), 跟著重新開機便算了...


    但直到最近, 我才發現:

    Promise FastTrak TX2200 RAID card 無法更新至最新版本的BIOS, 安裝了Promise Array Manager後都無法檢測RAID 1及硬盤運作情況;

    更甚者, 本人於7 JUL 2009本來打算再一次檢查硬盤, 本人的粗心大意, 錯誤的啟動了其中一顆硬盤的Windows 2003 Server OS, 令到RAID 1無法運作, 並出現了BSoD.

    後來本人拔掉了出事的硬盤, 只用另一隻也受到影響的硬盤在RAID 1模式下單獨啟動, 修正了所有系統問題後, 利用RAID card去重建RAID 1 陣列, 怎料兩次重建完成後不能關掉程式, 被逼進行cold boot, 然後RAID card便告訴我無法正常運行RAID 1陣列...

    但直至翌晚, 本人帶了自己的朋友去檢查伺服器時, 於重新開機後, 便發現RAID card說RAID 1 陣列正常運作, 到現在也想不通是甚麼原因...


    另外, 本人的朋友打開了伺服器看了一看, 也做過了小小抄寫檔案實驗後, 便告訴我一件重要的問題根源:

    該伺服器只有512MB實體記憶來運作, 若遇上公司工作繁忙時間, 實體記憶便會用清光, Windows 2003便會利用硬盤上的分頁檔案(Page File)來協助電腦運算, 但這令到硬盤運轉抄寫加劇;

    若收到要求讀取/寫入硬盤檔案的指令, 由於該伺服器的RAID card沒有記憶緩存, 有機會無法寫入硬盤裡, 因而造成Delayed Write Failed;

    而Windows 2003收到DWF的錯誤訊息後, 便會不斷偵測該錯誤是否仍然存在, 最終使伺服器及網絡癱瘓...


    本人現正希望各位大大能提供多些意見, 讓我能夠完全這個惱人的問題, 謝謝...
    2009年7月10日 上午 07:28
  • 有沒有可能是陣列卡出問題?
    蘇老碎碎念
    資訊無涯,回頭已不見岸
    2009年7月10日 上午 08:43
    版主
  • 我都認同你的說法, 因為正常的一張RAID card, 竟然無法去檢測陣列資料, 來來去去都只可以在開機時登入個RAID utility, 怎麼說都說不通...

    還有, 那張RAID card: Promise FastTrak TX2200根本就沒有記憶緩存, 極度倚賴伺服器的CPU和RAM來運作, 我和我老闆都打算更換RAID card, 但只可以換Promise FastTrak TX2300, 也是沒有記憶緩存的!! 唉...

    2009年7月10日 上午 08:57