none
クラスタ構成時のノードの再起動手順について RRS feed

  • 質問

  • お世話になります。

    有識者の方のお知恵を貸して頂きたく。

    Windows Server 2008 R2 SP1 EnterpriseのMSCS構成で、サーバの再起動手順が曖昧で、
    投稿させて頂きました。

    サーバマシンのWinupdate等で手動で再起動しなくてはならない時に、どのような手順で再起動をすれば
    宜しいでしょうか?
    下記に示すのが、現在行っている再起動手順です。
    正しいでしょうか。ご教授願います。

    【現状の再起動手順】
    <MSCS構成>
    ・ノード1、ノード2 + 共有ディスク + クォーラムディスク

    <手順(ノード1の再起動)>
    ①所有者(ノード1)の全てのリソースを片方のサーバ(ノード2)に移動
    ※フェールオーバークラスターマネージャー → このサービスまたはアプリケーションを別のノードに移動を選択

    ②フェールオーバークラスターマネージャーで、所有者(ノード1→ノード2)、サーバ名、ファイルサーバ、ディスクドライブ、
     その他のリソースが切り換った(オフラインからオンライン)ことを確認

    ③ノード1のマイコンで、共有ディスクがないことを確認
    ※クォーラムディスクは存在

    ④ノード2のマイコンで、共有ディスクがあることを確認
    ※クォーラムディスクはない

    ⑤クォーラムディスクが残っている状態で、ノード1を通常のWindows再起動手順で再起動を実施

    ⑥ノード2のマイコンとクラスタマネージャーで、クォーラムディスクと共有ディスクがノード1から移行されていることを確認
    以上、宜しくお願い致します。

    2012年9月5日 3:00

回答

  • 基本的に、再起動するノード上にサービスがなければよいと思います。

    ですので、記載されている手順で問題なしではないでしょうか?

    3.5 として、「クラスター グループ」をPowershellもしくはコマンドを使用して移動してもいいですね。

    以上、参考になれば幸いです。


    MVP:Virtual Machine Blog:MCTの憂鬱

    http://naonao71.wordpress.com/

    • 回答としてマーク monmon-chan 2012年9月10日 0:26
    2012年9月6日 2:40
    モデレータ

すべての返信

  • 基本的に、再起動するノード上にサービスがなければよいと思います。

    ですので、記載されている手順で問題なしではないでしょうか?

    3.5 として、「クラスター グループ」をPowershellもしくはコマンドを使用して移動してもいいですね。

    以上、参考になれば幸いです。


    MVP:Virtual Machine Blog:MCTの憂鬱

    http://naonao71.wordpress.com/

    • 回答としてマーク monmon-chan 2012年9月10日 0:26
    2012年9月6日 2:40
    モデレータ
  • ABE NAOKI 様

    ご回答ありがとうございました。

    また、参考URLも添付して頂き、ありがとうございます。

    ご参考にさせて頂きます。

    一点、気になる点があります。

    それは、再起動する際、所有者側にクォーラムディスクのみが存在するといことです。

    これは、再起動するとペアのサーバに移動するので、問題ないとは思っているのですが、

    問題はないのでしょうか。

    ご存知でしたら、教えて頂きたく。

    なぜ、上記が気になるかというと

    以前、このフォーラムに「Windows Server 2008 R2でのクラスターエラーについて」というタイトルで質問したのですが、

    下記のエラーが出力されるようになってきました。

    このエラーはクォーラムディスクに関係していることから、上記の内容が気になりました。

    -------------------------------------------------------------------------------------------------

    (1)エラー
    ソース:FailoverClustering
    イベントID:1177

    クォーラムが失われたためにクラスターサービスがシャットダウンしています。クラスター内の一部またはすべてのノードとのネットワーク接続が失われたか、監視ディスクのフェールオーバーが原因となっている可能性があります。

    -------------------------------------------------------------------------------------------------

    以上、宜しくお願い致します。

    2012年9月6日 6:14
  • すでにお答えされているので、横から失礼ということになりますがしたのMSのブログにイベントID:1177 について説明があります。
    http://blogs.technet.com/b/askcorejp/archive/2012/04/02/t.aspx

    「上記イベントが記録された場合、もし他のノードがユーザー操作等による意図した再起動などで
    サービスが停止している状況で、過半数を維持できていない状況であれば、これは想定された
    動作となり特に問題ございませんのでイベントは無視していただいて構いません。
    なお、このイベントが記録されることを回避する方法はございません。」

    (MS KB)
    Windows Server 2008 フェールオーバー クラスターをシャットダウンすると、クォーラムを失ってサービスが停止することがある
    http://support.microsoft.com/kb/2536102/ja

    再起動するとクォーラムと共有ディスクがペアのサーバに移動しているということであれば問題ないと思いますが。


    試験問題作成委員会(http://shikenmondai.blog.shinobi.jp/)

    2012年9月6日 17:27
  • 試験問題作成委員会 様

    ご返信ありがとうございます。

    以下の2点に関して、ご存知でしたら教えて頂けないでしょうか。
    宜しくお願い致します。

    1.確認事項
    (1)イベントID:1177が出力された原因に関して、ご存知でしたら教えて頂きたく。

      以前、同クラスタサーバに対し、同じ手順(初めの質問に記載した再起動手順)で再起動を行っていたのですが、
       イベントID:1177のエラーは出力されませんでした。
       今回、初めてエラーが出力され、何が原因でエラーが出力されたのが、不明な状態です。
      ※構成に変更なし。但し、共有ディスクのデータは日々増加している。
      ※共有ディスクは、SQL Server 2k8のデータ格納先


      同じ構成のクラスタサーバがいくつかあるのですが、
      これらに対しても同じ手順で再起動してもエラーは出力されません。
      ※共有ディスクのデータ量に変化なし(これもSQL Server 2k8のデータ格納先)

     
      上記のことから、イベントID:1177が出力した原因として、リソースの増加が原因でリソースのオフラインに時間を要したためだと
      私は思っているのですが・・・ 
       もし、これが原因だということになれば、
      <http://support.microsoft.com/kb/2536102/ja>に示される回避策(QuorumArbitrationTimeMaxの値を大きくする)を

      実施すればいいのでしょうか。


    (2)以下に示す(イベントID:1069,イベントID:1135)が出力された原因として、イベントID:1177による影響なのでしょうか。

      イベントID:1177の出力と同時に以下のエラーが出力されました。
      以下のエラーは、イベントID:1177の影響によるものなのでしょうか。
      また、これらのエラーも無視していいのでしょうか。

      (エラー)
       ① ソース:FailoverClustering
       イベントID:1069

       クラスター化されたサービスまたはアプリケーション'クラスターグループ'のクラスターリソース'xxxxxxxx'は失敗しました。

       ② ソース:FailoverClustering
       イベントID:1135

       クラスターノード' サーバ名 'がアクティブなフェールオーバークラスターメンバーシップから削除されました。
       クラスターサービスがこのノードで停止されている可能性があります。


    以上、宜しくお願い致します。

     

    2012年9月7日 1:26
  • 手動で片ノードを再起動させてイベントログにエラーが出るようなら
    (以下は、Windows Server 2003 MSCSの情報になりますが)
    Microsoft Cluster Server 上のフェイル オーバー/フェイル バック ・ ポリシー
    http://support.microsoft.com/kb/197047/ja
    「既定では、グループはフェールバックしない設定されます。フェイル オーバーの後、グループへフェイル バックを手動で構成されていない場合、障害が発生したノードがオンラインに戻った後、代替ノード上で実行が続行されます。」
    フェイル オーバー/フェイル バック ポリシーによって所有者を移動させる方法もあるようです。

    (過去ログ)
    http://social.technet.microsoft.com/Forums/ja/windowsserver2008ja/thread/60fe3878-6d23-4a57-83e2-123c346ad294
    (参考ブログ)
    http://naonao71.wordpress.com/tag/msfc/

    ソース:FailoverClusteringのイベントエラーについてはしたのMSのページに情報がありますが間違いのないことはMSのサポートへ確認されたほうがよいでしょう。

    Event ID 1069 — Clustered Service or Application Availability
    http://technet.microsoft.com/en-us/library/cc756225(v=ws.10).aspx
    Event ID 1135 — Cluster Service Startup
    http://technet.microsoft.com/en-us/library/dd353973(WS.10).aspx
    (英語のフォーラムの過去ログ)
    http://social.technet.microsoft.com/Forums/en/winserverClustering/thread/a8f9cc78-1461-4001-921f-5b1df841243b 


    試験問題作成委員会(http://shikenmondai.blog.shinobi.jp/)


    2012年9月7日 2:54
  • 試験問題作成委員会 様

    ご返信ありがとうございます。

    また、参考URLまで教えて頂きありがとうございました。

    参考にさせて頂きます。

    上記のエラーに関して、無視していいものなのか

    まだ不明なので、もう少し調べたいと思っています。

    以上

    2012年9月11日 2:05