トップ回答者
Windows Server 2003 R2 SP1にて、ネットワークが不安定になる

質問
-
タイトルのとおり、ネットワークが不安定になり、ドメインコントローラにて、送信/受信ともpingすら通らない事象が発生してしまいました。
イベントビューア上にも関連するログが表示されていなく、ハードウェア障害を検出するツール上でも、エラーが発生していないため、ハードウェア障害である可能性は低いと思い、こちらに投稿させていただきました。皆様のご助力をいただければと思います。
構築している環境は以下のとおりです。
・使用している機材はドメインサーバ側もクライアント側もWindows Server 2003 R2 SP1
・シングルドメインにてドメインサーバを構築⇒以降サーバAとする。
・サーバAと同じドメインにドメインコントローラを構築⇒以降サーバBとする。
・サーバAが故障してしまったため、サーバAを廃棄し、サーバBのIPをサーバAに変更し、2年ほど継続して使用した。
・サーバBが故障した場合を考慮し、サーバBと同じドメインにドメインコントローラを構築⇒以降サーバCとする。
・ドメインはシングルドメインで、フォレストの機能レベルはWindows 2000で、ドメインの機能レベルはWindows 2000混在。
・サーバB/サーバCとも、優先DNSにはサーバBを指定し、代替DNSにはサーバCを指定。
・サーバBとサーバCは異なるサブネットで構築していて、デフォルトゲートウェイを設定することで以前は通信可能だった。発生している事象は次のとおりです。
・サーバCにActiveDirectory構築以前は正常に通信ができた。
・サーバCからサーバBへのpingが通らなくなった。
・サーバCに接続しているHUBに対してpingが通らなくなった。
・クライアントからサーバCへのpingが通らなくなった。
・長時間pingを流してみたところ、数分間pingが成功し、その後数分間pingがタイムアウトする状況が交互に繰り返し発生した。
・サーバCのデフォルトゲートウェイおよびDNSの設定をはずすことで、正常にpingが通った。2011年7月22日 8:47
回答
-
こんにちは、フォーラムオペレーターの三沢健二です。
下記のコメントが少し気になりました。
> 現在は、二つあるポートをチーミングし、冗長構成にて使用しています。ですが、結果は変わらず、一方で通信ができない状況になっても、ポートは切り替わりませんでした。(手動で障害が発生したポートのケーブルを切断してみましたところ、他方に切り替わって通信が可能になりましたので、チーミングでは障害として検出できないみたいでした。)
あくまでも個人的な経験に基づくアドバイスになりますが、、、
エラーがないのでハードウェア障害の可能性は低いという事でしたが、"エラーがない = 問題がない" とは言い切れないと思います・・・
(チーミング構成でネットワークトラブルが発生し、何も手掛かりがなくて、最終的には NIC 交換、もしくはドライバやユーティリティの更新で解決したといったケースは何度か見たことがあります)
設定の問題である可能性も考えられますが、もし可能であれば、ベンダーのサポートなどにご相談された方が良いのではないかなと思われます。
それでは、こちらの情報が少しでもお役にたてれば幸いです。______________________________________
日本マイクロソフト株式会社 フォーラム オペレーター 三沢健二- 回答としてマーク umion 2011年8月8日 10:47
2011年8月3日 5:58
すべての返信
-
チャブーンです。
まず、前提条件として「ハードウェアとしてのハブ」に問題はありませんか?念のためチェック(他のポートを使ってみるとか)をお奨めします。
状況としてDNSの名前解決に問題がある、ように思えます。「DNSサーバーの設定を外したら問題なくなった」はおそらくDNSサーバーの設定に問題があり、NetBIOSでのブロードキャストで名前解決ができるようになった場合によく起こるケースです(これは同じサブネット内にコンピュータがあるときに限られます)。
ご自分で対応するなら、一つずつ切り分けを行って、問題を特定するしかないでしょう。設定を元通りに戻した上、
- IPアドレスでpingが通るかどうか(ネットワーク経路上に問題がないかチェックします)
- FQDNで`pingが通るかどうか(名前解決の過程に問題ないかチェックします)
- nslookupコマンドで「サーバーBとC両方のDNSサーバーそれぞれにクエリを行うよう」名前解決を実行する(どちらかのサーバーの名前解決に問題があるかどうかチェックします)
また、もしかしたら2枚のNICを使って「マルチホーム」な環境に設定していませんか?このような使い方だと、ネットワーク経路がわかりづらくなるうえ、DNSの名前解決上問題が起こることがあります。こういう環境であればNICは1枚にして、問題を切り分けた方がいいでしょう。
あと、「イベントログに関連するモノはない」ということですが、本当にまったく存在しないのでしょうか?「エラー」だけではなく「警告」イベントも対象になります。普通はうえのような切り分け+ネットワーク環境やイベントログをチェックして、総合的に問題を解決することになりますので、こういう掲示板でのサポートは厳しいです。MSの有償サポートにお願いした方が、よいかもしれませんね。
2011年7月25日 2:57 -
チャブーンさん。返信していただき、ありがとうございました。
返信いただきました内容を踏まえて、こちらでいろいろな確認を実施いたしましたので、ご報告いたします。
まず、「ハードウェアとしてのハブ」に関してですが、サーバCには2つのポートが搭載されており、一方のポートのみを使用していた、他方のポートを無効としておりました。そこで、別のポートに接続しましたが、事象は変わりませんでした。また、ハードディスクを別のサーバと交換しても同じ結果でしたので、NICは正常に動作している様子でした。
加えて、接続しているHUB側も確認いたしましたが、特にメッセージも出力されていなく、別のHUBを使用しても不安定なままでした。次に切り分けについてですが、ネットワークが安定しているときは、サーバBおよびサーバCとも外部の端末からnslookupによるドメイン名の名前解決が可能でした。
Pingはネットワークが安定している時しか確認できませんでしたが、サーバBからサーバCへも、サーバCからサーバBとも、IPアドレス及びFQDNのそれぞれで通信可能であることを確認いたしました。ネットワークが不安定になる時点でのイベントログを確認してみましたが、情報ログすら出力されておりませんでした。(ストレージの死活監視を実施するツールが「接続できません」と出力するだけでした。)また、NICは一枚しかなく、マルチホームは当時設定しておりませんでした。
次の切り分けとして、AD及びDNSが問題になっていると思いましたので、ActiveDirectoryの役割をサーバCから削除・降格してみましたが、事象は発生いたしました。ですので、ActiveDirectory関連の事象ではないのかも知れません。(SYSVOL等は削除されましたが、Ntfrsは起動していましたし、メンバーサーバにはなっているので、完全に切り分けることはできていませんが。。)
また、ネットワークの設定に問題があるかも知れないため、Pingを流したまま、デフォルトゲートウェイの設定を削除・再設定してみたり、DNSの設定を削除・再設定してみたりしましたが、結局ネットワークは不安定なままでした。現在は、二つあるポートをチーミングし、冗長構成にて使用しています。ですが、結果は変わらず、一方で通信ができない状況になっても、ポートは切り替わりませんでした。(手動で障害が発生したポートのケーブルを切断してみましたところ、他方に切り替わって通信が可能になりましたので、チーミングでは障害として検出できないみたいでした。)
こちらでも、各作業を確認しながら進めているのですが、原因はわからずじまいです。
何か大きな勘違いをしているかもしれないので、お気づきの点を指摘していただけると幸いです。
申し訳ありませんが、よろしくお願いいたします。2011年8月2日 9:30 -
こんにちは、フォーラムオペレーターの三沢健二です。
下記のコメントが少し気になりました。
> 現在は、二つあるポートをチーミングし、冗長構成にて使用しています。ですが、結果は変わらず、一方で通信ができない状況になっても、ポートは切り替わりませんでした。(手動で障害が発生したポートのケーブルを切断してみましたところ、他方に切り替わって通信が可能になりましたので、チーミングでは障害として検出できないみたいでした。)
あくまでも個人的な経験に基づくアドバイスになりますが、、、
エラーがないのでハードウェア障害の可能性は低いという事でしたが、"エラーがない = 問題がない" とは言い切れないと思います・・・
(チーミング構成でネットワークトラブルが発生し、何も手掛かりがなくて、最終的には NIC 交換、もしくはドライバやユーティリティの更新で解決したといったケースは何度か見たことがあります)
設定の問題である可能性も考えられますが、もし可能であれば、ベンダーのサポートなどにご相談された方が良いのではないかなと思われます。
それでは、こちらの情報が少しでもお役にたてれば幸いです。______________________________________
日本マイクロソフト株式会社 フォーラム オペレーター 三沢健二- 回答としてマーク umion 2011年8月8日 10:47
2011年8月3日 5:58 -
チャブーンです。
応答が遅くなりましたが、ネットワークの応答が不安定という場合、やはり2つの点に問題があるのではないでしょうか?
- ハードウェアの問題
ハードウェアについては、OS側からでは「正常に動作している前提」でしか動作しないので、問題がある場合ハードウェアがきちんと動作してるか、確認いただく方がいいかと思います。完全(に近い)なチェック方法としてはやはり別の単体NICを一時的に用意してもらう、ということになります。なお、意外とケーブルの問題ということもありますので、ケーブルも別のものに変えていただくことを奨めます。 - NICの設定(TCPオフロード)の問題
通信があるNIC間で、どちらかのみがTCPオフロードに対応していない状況でTCPオフロードの設定がONになっていると、通信が安定しません。TCPオフロード等の設定はOSレベルだとNPSという方法で実装されていて、Windows Server 2003 SP1はNPSは実装されていません。ですが、NIC単体でこの機能がONになっていたり、アンチウイルスソフトのネットワーク最適化機能等で実装されていることがあるので、NICドライバのプロパティの確認やアンチウイルスソフトの一時的なアンインストール、などで状況が好転することがあります。
とりあえずは、こんなことはいえそうです。
2011年8月4日 3:29 - ハードウェアの問題
-
三沢健二さん。チャブーンさん。ご回答いただきまして、ありがとうございました。
お二方のご意見にもございますとおり、NICに問題があるかもしれません。
以前確認した際に、HDDを別の機材に搭載して起動してみたのですが、変わらずに事象は発生したので、ハードウェアの問題ではないと考えておりましたが、ベンダーに確認してみたところ、デバイスドライバの修正モジュールが公開されておりました。。。
同じ型番のNICではなくて「別の単体NIC」で確認しなければいけないのですね。。。。現在手元には無いのですが、今後同じように調査する場合は気をつけさせていただきます。このデバイスドライバの更新で解決する保障はありませんが、一応の解決案をいただきましたので、このスレッドは閉めさせていただきます。
三沢健二さん。チャブーンさん。長い間ご回答いただきまして、ありがとうございました。
2011年8月8日 10:49