none
MOSS又讓我花轟了 >_< RRS feed

  • 問題

  • 各位先進:
          我家的moss又讓我花轟了....有二次,第一次是資料庫自己停止,相關問題我在資料庫論壇上發問,可是
    沒有答案,只能確定資料庫是由ap發出停止的訊號出來
    http://social.technet.microsoft.com/Forums/zh-TW/sqlservermanagementzhcht/thread/69766fbf-ae73-4149-8014-320e8b2c312a


    第二次是在某個愉快的週日,它當機了,當時症狀: 所有serivce正常執行,沒有任何錯誤訊息,但是IIS不工作

    真的是不工作哦,雖然服務那裡仍秀出執行中,可是所有client都連不上moss,我的moss架構如下
    1.ap(無search服務)+db(sql2005 sp3)
    2.ap(search,index)
    當機時,ram大約吃6G,實體ram有8G,CPU2顆4核心xeon

    後來,把iis restart後恢復正常,我真的無法提供什麼錯誤訊息,因為完全沒有!

    那麼,想請教其他先進,是否有過同樣經驗?如何預防?有無什麼工具可以幫我
    測出這種鬼狀況的?

    2010年8月10日 上午 06:58

解答

  • 當天的狀況真的很怪,因為大家開網站都是呈現網站已找到,正在等待中,最後就整個視窗一片白在那裡,也沒有說錯誤,也沒有說timeout

    網站已找到,IIS log 就不應該沒有記錄。

    沒錯,為了應急先恢復是最快的,不過下次遇到這種狀況,可以收個memory dump 然後就可以IISReset 事後再分析的。

    http://support.microsoft.com/kb/286350 

     


    http://sharepoint.idv.tw
    2010年9月16日 下午 04:38

所有回覆

  • IIS內的Application Pool設定中,有Recycle回收相關的設定,那邊有調整過嗎? 我的四部MOSS2007 WFE跑了很久也不太會停下來耶,我想會不會是Application Pool有出狀況

    2010年8月11日 上午 04:17
  • 有,每天定時4次回收使用者工作處理序
    可是,比較奇怪的是, 是一整個IIS死當....因為我上面除了主要的moss網站外, 還有其他的如個人網站,moss的管理中心,
    全都起不來....,照理說,死一個Application Pool不會讓所有網站都進不去....可是這次是整個 iis 都掛點....最大的一個W3WP.EXE
    吃了400M的ram,其次是320M左右,其他吃最大的是sql2005,吃了2G多近3G,可是sql2005我當下測試運作是正常的,就是IIS連
    動都不動,service list裡它又活得好好的.....最後才乾脆下 iisrestart  >_<, 然後, moss就活了.....

    感謝回覆!

    2010年8月11日 上午 05:15
  • 我一直懷疑OWSTimer程式的處理狀況,你可以觀察一下!!
    屠立剛(JosephTu)
    2010年8月12日 上午 05:34
    版主
  • 謝謝屠老師! 8/13的課又讓我充了不少電~ 精彩!! ^_^
    其實,我也一直在懷疑owstimer的狀況,因為它已經不是第一次出問題了...
    而且它一出狀況都很大 o_o 或許是因為moss都靠它來做所有的幕後工作如定時排程等等之故

    只是,我現在沒有工具來證明我的一些想法,還有重現狀況
    而且,這個事件是我從架好moss以來第一次發生....之前別的系統也有發生過一模一樣的狀況,
    只是,也是很久很久才會發生一次,所以大家遇到都是直接下 iisrestart :D

    不知道屠老師有沒有什麼好用的工具可以提供? 謝謝!

    2010年8月16日 上午 12:45
  • MOSS 2007還真的不多!!sharepoint 2010有完整的powershell,正在整理中!!
    屠立剛(JosephTu)
    2010年8月19日 下午 01:15
    版主
  • Hi 您好 :

    要不要考慮使用SCOM 2007 R2來監測看看呢 ~

    Thanks

    SharePoint Server 2010 活學活用實務免費課程 :

    http://technet.microsoft.com/zh-tw/ff859538.aspx

    Jovi

    2010年9月7日 上午 05:49
  • IIS 不工作的狀況能描述一下嗎?

    是有錯誤訊息還是一直沒辦法驗證過?

    您有沒有檢查過Event Log , IIS Log , sharepoint Log ?

    我想事出必有因,一定有跡可尋,用猜的不如實際去檢查一下比較實在。


    http://sharepoint.idv.tw
    2010年9月15日 下午 05:46
  • 感謝顧大俠回覆, SCOM 2007 R2? 恕我愚昧, 不知道這是什麼軟體 o_o
    能否介紹一下?
    ps.我們公司的MOSS是當初您和您公司的工程師來架設的喲 :)

    2010年9月16日 上午 12:12
  • 謝謝您的回覆, 我會猜就是因為不管在 EventLog 還是IIS Log, Sharepoint Log
    裡面都沒看到什麼可疑的因素,但是IIS就是完全不工作,而且當時的狀況是 web
    services一直"活著", 當時產線又急著要用, 於是根據多年前的一次一模一樣的
    事件來做iis restart的動作處理
    當時IIS的狀況是:所有網站活著,service活著,ping有回應,但是開啟網站就是開
    不起來,我們有4個網站,4個都開不起來,cpu有2顆,總共8個核心都處於idle,ram
    吃了6G(總共8G),連我自已做了一個測試html網頁都開不起來

    事後觀察所有LOG,沒有紀錄,那段時間空白,連我執行html測試頁都沒紀錄下來!
    只有到下iis restart後才開始紀錄,最後一筆有紀錄的事件,是正常結束的,於是...
    我花轟了.......

    2010年9月16日 上午 12:28
  • 您還是沒有說明開不起來的具體狀況是什麼。

    就算華陀再世沒有徵狀也沒辦法診斷。

    Event log 沒有,就看SharePoint Log,SharePoint Log 看不懂,IIS Log 總會有記錄吧。

    如果IIS 沒記錄,就代表還沒進到IIS,您說IIS 都吃了幾百MB,IIS的memory 總會有起伏,如果w3wp都死了,就去開啟IIS 的Event ,預設是沒全開的。

     


    http://sharepoint.idv.tw
    2010年9月16日 下午 12:17
  • 我已經描述的很具體了

    當天的狀況真的很怪,因為大家開網站都是呈現網站已找到,正在等待中,最後就整個視窗一片白在那裡,也沒有說錯誤,也沒有說timeout

    我也講得很清楚,IIS LOG那段時間沒有紀錄,memory也沒有起伏,執行其他應用程式正常,就是IIS不正常,這種事件在我們公司出現過9次,其中MOSS佔了二次,第一次和第二次間隔2.5年;其他則是不同server各出現一次,大家遇到這狀況,二話不講,就是iisrestart,我們其他server也沒做什麼,很單純的當asp.NET的執行環境+TERMINAL SERVER,他們的iis掛掉時,也是一個w3wp吃了幾百M,然後網站怎麼連都是有回應但一片白,然後什麼log都沒有

    基本上,下次再遇到這個問題,我還是會下 iisrestart來解,因為產線不可能等你MIS慢慢解決,只是我現在缺的是能夠monitor MOSS的工具,能夠讓我提出數據向老闆解釋的數據,老闆只認數據當證據,不相信我們第一線處理的直覺判斷

     

    2010年9月16日 下午 02:35
  • 當天的狀況真的很怪,因為大家開網站都是呈現網站已找到,正在等待中,最後就整個視窗一片白在那裡,也沒有說錯誤,也沒有說timeout

    網站已找到,IIS log 就不應該沒有記錄。

    沒錯,為了應急先恢復是最快的,不過下次遇到這種狀況,可以收個memory dump 然後就可以IISReset 事後再分析的。

    http://support.microsoft.com/kb/286350 

     


    http://sharepoint.idv.tw
    2010年9月16日 下午 04:38
  • 網站已找到....我倒覺得不見得表示已經進到IIS了,因為只是dns找到了而已
    它只是說http://xxxx.com.tw已找到,並沒有做轉到正確的首頁(正在開啟http://xxxx.com.tw/Pages/default.aspx)的動作哦...

    MEMORY DUMP....下次如果真的有遇到這種鬼狀況,再看情況試吧,因為掛掉1分鐘就損失幾十萬更可能上百萬的壓力常常讓我們
    這些MIS花轟的,而且老闆要求的救援時間很有限(非系統或db或硬體crash,扣除到場救援前的時間只有3分鐘), 又要數據佐證我
    們判斷出事的原因, 也要平常就能掌握MOSS所有的運作,包含底層架構的運作細節, 這個動作做了老闆也只滿意不到一半 o_o
    唉...

    2010年9月21日 上午 01:10
  •  

    是喔 ~ 弄得很神祕喔 ~ 把我加入MSN吧 ~ joviku@msn.com

    關於SCOM 2007 R2的中文官方網站如下 , 看一下吧

    http://www.microsoft.com/taiwan/systemcenter/operationsmanager/default.aspx

     

    Thanks

    SharePoint Server 2010 活學活用實務免費課程 :

    http://technet.microsoft.com/zh-tw/ff859538.aspx

    Jovi

    2010年9月30日 上午 04:22