質問者
【なぞが解ける方お願いします】Windows 2000 Serverのバックアップドメインコントローラで原因不明のダウン

質問
-
現在windows 2000 server でドメインコントローラ(以下DC)、バックアップドメインコントローラ(以下BDC)が動いている環境がございます。
最初の問題現象はBDCが「予期せぬシャッドダウン」により、急に電源が落ち勝手に起動していました。
最初は月に1回程度でした。
最近は上記頻発しハード(マシン)は電源が付いていましたが、今度はOSが立ち上がっていない状況になりました。(※筐体の電源ランプ点灯、ファンは回っている)
上記から電源ボタンで強制終了し再起動してしばらく運用していましたが、ついにマシンも動かず電源ボタンを押しても何も反応しなくなりました。
電源が付かなくなったということでハードが原因の可能性が高いと思い、中古で同型マシンを購入しました。(※新品は生産していないマシンのため)
ここから個人的になぞ現象なのですが、中古マシンでwindows 2000 server のBDCを再セットアップしました。
が、この中古再セットアップしたBDCでも同じ現象が起きました。(※急に予期せぬシャッドダウンの繰り返しで最終的に起動しなくなる)
以下切り分けで実施した内容になります
・イベントビュアーでは「予期せぬシャッドダウン」のログのみ
落ちる前のログで怪しいログ、毎回出ているログなどがありませんでした。
・電源タップの交換、コンセントの取得場所も変えましたが変わらず
・LANケーブル、ハブも変えましたが変わらず
・twiseでダウン前の状態を監視しましたが、CPU異常、パケット負荷などは見られませんでした。(急にping不可になる)
・同型ではない違うマシンでBDCを再セットアップして運用しましたが、こいつでも同現象が発生した(※W2Kとマシンの相性問題ではない?)
個人的にかなり切り分けをしましたが、原因がわからない次第です。
そして今は完全に起動しなくなったと思って久々に電源を付けたら起動しました。(※けどその後一週間に一回程度は落ちて起動する)
何か切り分けの情報や小さな手がかりなどございましたら、ご教授願います。
出来る限りの切り分け作業は実施したいと思います。
なんでも構いません、宜しくお願い致します。
すべての返信
-
お馬鹿様、七辻屋様
ご回答ありがとうございます。
"Kernel-Power ID41" のイベントログを探しましたが出力されていませんでした。
※Win7やwin2008serでの記事はありましたが、古いOSのw2kにも出るんですかね。。。
>
黒翼猫さんの所で、「予期せぬシャットダウン」「6008」「eventlog」「ダウン」で検索しましたが、それらしい記事はヒットしませんでした。
今サーバーを見たらまた落ちてました。今度は電源ボタンで強制終了後起動してもOSが立ち上がりませんでした。
(※筐体だけ動いているだけ、画面に何も表示されないのでBIOS起動すらしない)
やっぱり難しいのでしょうか。。。。
-
すみません。windows 2000 server の古いIFなので詳細タブがございません。
イベント情報は以下です。
ソース :EventLog
ID :6008
分類 :なし
説明 :以前のシャットダウン(日付)は予期されていませんでした。
上記がam3:00頃発生しておりまして、その前のログは14時間前に以下ログが出ています。
ただし、前回のダウン後のサービス開始内容になります。
(ソース/ID/説明)
Wins / 4097 /WINSは正しく初期化されました。操作を開始できます。
SNMP / 1001 /SNMPサービスは正常に開始されました。
EventLog / 6005 /イベントログサービスが開始されました。
> BIOS すら起動しないのであれば、OS は関係ないのでは?
私もそう思ったのですが、同じ中古マシンと違う筐体でも同じ症状が出たので3台同時にハードが元々壊れているのは考えにくいと思いました。。
また、起動する時もあります。
疑っているのが、ソフトが原因でハードが故障したという考えなのですが、そんなことがあるのかなと。。
であればその切り分けが分からず進まない状況です。
-
チャブーンです。
この件ですが、明らかに情報が足りないと思います。
- 具体的なサーバーの機種名はなにか(個別の不具合情報の確認に必要です)
- Windows 2000 Serverの「サービスパック」と更新プログラムの適用状況(IEのバージョンは何なのかも含む)
- 内部で動いているのはドメインコントローラーのほか、どんなサービスがあるのか
はっきりいってサービスパック4が当たっていない、更新プログラムがあたっていない、という状態だと、安定した動作にならないケースが多いと思います。(サーバーで使っているドライバーの前提条件と異なる)
また、ドメインコントローラーの機能以外にIISが入っていたりすると、最悪のケースですがCodered(懐かしいですが...)等ウイルスに感染している可能性も考える必要があると思います。ドメインコントローラー自体共有フォルダーをホストしているので、その他のウイルス(nimdaとか)に感染している可能性も0ではないと思います。
そして今は完全に起動しなくなったと思って久々に電源を付けたら起動しました。
BIOSレベルで起動がうまくいかない場合、接続された機器(例えばNIC等)を含む基本チェック(POST)がうまくいかないケースがあります。地道ですが、接続機器をひとつづつ外して確認する、といった切り分けがいると思います。これを避けたい場合、完全に電源コードを抜いて数分放置し、基盤内の電荷を0にすると直ります。古いサーバーだとシステム時刻がリセット(1900年等)されることがあるので、OS起動前に確認・修正するべきかと思います。
フォーラムは有償サポートとは異なる「コミュニティ」です。フォーラムでご質問頂くにあたっての注意点 をご一読のうえ、お楽しみください。
-
ダンプ ファイルを生成させる設定は、行っているんですよね?
-----------------------------------------------
ダンプファイル採取手順
http://esupport.trendmicro.com/solution/ja-jp/1103793.aspx?print=true【Windows2000】
[1] マイコンピュータを右クリックし、プロパティを開きます。
[2] 「詳細」タブの「起動/回復」ボタンをクリックします。
[3] 表示された画面の「デバッグ情報の書き込み」欄で次を選択します。
「完全メモリダンプ」
[4] 初期設定でWINNTフォルダ内に「Memory.dmp」ファイルが作成されます。
-----------------------------------------------上記に示した手順での設定が行われているのにも関わらずダンプ ファイルが生成されていないのであれば、ハードウェア的な問題である可能性の方が高いと思います。
「ソフトが原因でハードが故障した」という可能性は一般的には無いと思いますが、私が直接調べた訳ではないので、断言はできません。
上記に示した Windows 2000 でのダンプ ファイル設定で「自動的に再起動する」のチェックボックスがあるなら、一旦そのチェックボックスでのチェックを外し、ブルースクリーン画面でとまるか確認された方が良いと思います。
ソフトウェア的な要因で発生しているなら、必ずブルースクリーン画面で止まるはずです。あとウィルス感染に関しては、感染の有無は別として、それが原因である可能性はほぼ無いと思います。
システムがダウンしたらウィルス自身も何もできない状態となるので、システムをダウンさせることはウィルス自身にもメリットは無いと思います。
(単に嫌がらせをしたいだけのウィルスならその可能性はあるけど、だったらダンプ ファイルを生成させずにシステムをダウンさせるのは至難の業かと。) -
はい。生成される設定になっております。
今確認しましたが、やはり「完全メモリダンプ」でWINNTフォルダ内に作成されるようになっていました。
ダンプファイル設定に「自動的に再起動する」のチェックボックスがありましたので、まずはブルースクリーンの有無を確認したいと思います。
現状は起動していますので、次いつ落ちるかは不明なので症状が出ましたら報告させて頂きます。
ウイルスも思いましたが、再セットアップ後もすぐに現象が出たのでないかとは思います。
しかし違うw2kのサーバーが動いているので、そいつからBDCに攻撃するやつであればいくらBDCを再構築してもダウンすることは考えられますね。。
まずは上記対応をしますが、他に切り分けネタがあればどなたでも構いませんお願い致します。
やはり、なぞ現象ですね。。。。。
-
チャプーン様
ご回答ありがとうございます。
> 具体的なサーバーの機種名はなにか(個別の不具合情報の確認に必要です)
⇒Dell PowerEdge 600SC ×2台 と Dell PowerEdge 2800 で再セットアップし全て同じ現象が発生しました。
> Windows 2000 Serverの「サービスパック」と更新プログラムの適用状況(IEのバージョンは何なのかも含む)
⇒SP4とIE6にはしております。以下「現在インストールされているプログラム」の記載全てになります
・Intel(R) PRO Network Adapters and Driers
・Micorsoft Internet Explorer 6 SP1
・Microsoft ファイアウォールクライアント (※ISA用)
・Windows 2000 SP4 対応の更新プログラム ロールアップ1
・Windows 2000 管理ツール
> 内部で動いているのはドメインコントローラーのほか、どんなサービスがあるのか
⇒バックアップドメインコントローラとWINSの機能追加しかしておりません。
なので、機能としてはBDC、DNS、WINSとなります。
> これを避けたい場合、完全に電源コードを抜いて数分放置し、基盤内の電荷を0にすると直ります
OS(BIOS)が起動しない症状として2種類ありまして、
1.電源ボタンを押して電源ランプ点灯・ファンも稼動している(ボード全般は動いて見える)がDellのロゴ画面すら表示されない
2.電源ボタンを押しても何も反応がない(電源ランプすらつかない、ファンも回らなく全く通電されていなく見える)
「1.」の際に電源コードを抜いて放置と電源コードを抜いて放電(電源ボタン数回押下)しましたが変化はありませんでした。
ただし「久々に電源を付けたら起動しました。」は一週間は放置していたので、それくらい放置しないとリセットされなかったということでしょうか。。。
再度ダウンして一週間ほどして起動するのであれば、BIOSのチェックがうまくいっていないことになりますね。
ただやはり、BIOSが原因でも違う筐体で同じ現象になるものでしょうか。
違う筐体で同じ機器(NICなど)が原因ならそれが壊れる原因を探る必要がありますが、どこから調査していいか検討が付きません。。。。
-
- Dell PowerEdge 600SC
www.dell.com/downloads/jp/products/pedge/poweredge600sc.pdf - Dell PowerEdge 2800
www.dell.com/downloads/jp/products/pedge/poweredge2800.pdf
どちらも相当に古いマシンですねえ。何となくハードウエアの老朽化による物理障害のような気が....
P2V して仮想化環境で稼働させてみるとどうなるか、とか考えられますが技術的にもライセンス的にもハードルが高そうですね。
hebikuzure
- Dell PowerEdge 600SC
-
> 合計3台BDCとしてセットアップして全て同じ筐体劣化が原因でダウンするするとは思えなく、
まあ、確かにそうなんですが、それ以外にこれと言って考えられるシナリオもないので。
それでハードウェアに依存しない P2V をしたらどうなるのか、と思ったわけです。
いずれにせよいつまでも Windows Server 2000 を稼働させておくこともできないでしょうから、自力で問題解決するのにエネルギーを投入するのが良いか、現在の環境に見切りをつけてサポートされているバージョンの(当然ハードウェアも新しく保証のある)環境に移行するのにエネルギーを投入するのか、検討するタイミングかもしれません。
hebikuzure
-
hebikuzure様
そうですよね。現在は新サーバー構築を進めている状況です。
上層からのゴーが出ないと入れ替われない状況ですので、少なくとも半年~1年は現状のマシンを動かさないといけないので、
最低限の工数で調査するスタンスではいます。ありがとうございます。
ご回答ありがとうございます。
マザーボードのボタン電池交換も試しましたが、やはりダメでした。
もちろん電源ユニット交換、HDD交換、メモリ抜き差し、軽い清掃、電源ケーブル交換等しました。(※そもそも筐体ごと変えた。。。。)
やはり皆さん実際に見てみないと分からないというのが正直な所だと思います。
皆さん本当にいろいろありがとうございます。
半分諦めようかと思いますが、また空いた時に探りたいと思います。まだ必要情報、切り分け情報などございましたらお願い致します。
また、関係ないかと思いますが、本日同じようなW2Kで動いているマシンのDドライブが破損しました。更に新サーバー用に立てているマシンのHDDが警告ランプがでました。たまたまかもしれませんが、サージ付きタップを使用しているので過電流ではないですが、過電流以外で電気系統でマシンが壊れることがあるんですかね。。。んー、やっぱりなぞ現象でした。。
-
下記レジストリ キーで、"UpperFilters" と "LowerFilters" のエントリ名に設定されている内容を提示して頂けますか?
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Class\{4d36e967-e325-11ce-bfc1-08002be10318}
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Class\{71a27cdd-812a-11d0-bec7-08002be2092f}あくまでの推測ですが。。。。
もしかしたら、Disk か Volume のデバイス クラスにアタッチする 3rd ベンダー製フィルタ ドライバがインストールされていて、そいつがストレージ デバイス上の任意のセクタ データを物理的に破壊しているのかも。。。と思った次第です。
可能性はとても低いとは思うのですが、このシナリオだと、Bugcheck Code 0 でのクラッシュもあり得るので。
(Bugcheck Code 0 での BSOD はダンプ ファイルを生成しないので、ブルースクリーン画面も出てこない。)あとは。。。
"Driver View" というフリー ツールをダウンロードして、現在ロードされているドライバのうち、マイクロソフト社製以外のドライバを確認してみるのもいいかもしれません。
(Disk か Volume 以外にも、atapi ドライバなど別のデバイス クラスにアタッチしているフィルタ ドライバでも、セクタ データの物理的な破壊は可能なので。)
------------------------------------------------
DriverView v1.47 - Loaded Windows Drivers List
http://www.nirsoft.net/utils/driverview.html
------------------------------------------------ -
お馬鹿様
返信遅くなり申し訳ございません。
レジストリ内容を確認しました。
{4d36e967-e325-11ce-bfc1-08002be10318}の"UpperFilters"は以下になります。
種類:REG_MULTI_SZ
データ:PartMgr Diskperfそれ以外の{71a27cdd-812a-11d0-bec7-08002be2092f}には"UpperFilters" と "LowerFilters" 共にありませんでした。
フリーツールですが、会社規程でインストール可能か微妙なので、実施が出来次第ご連絡させて頂きます。
3rdパーティーのドライバはいれた認識はありませんが、調査観点で頭に入れておこうと思います。
-
> {4d36e967-e325-11ce-bfc1-08002be10318}の"UpperFilters"は以下になります。
> 種類:REG_MULTI_SZ
> データ:PartMgr Diskperf手元に Windows 2000 の環境が無いので断言はできませんが、"Diskperf" ドライバは OS 標準の Inbox ドライバではないのでは?
このドライバは、昔の DDK/WDK でサンプル ドライバとしてソース コードが公開されており、ドライバ開発者は各自でビルド/インストールすることで利用できたのですが、この名前の Inbox ドライバが存在するという話は聞いたことがありません。
なので、どこかの 3rd ベンダが自社ソフトウェアにバンドルしている可能性が考えられます。
このレジストリに "Diskperf" ドライバが登録されているということは、"%SystemRoot%\System32\Drivers" フォルダに "Diskperf.sys" ファイルが存在しているはずです。
Explorer から "Diskperf.sys" ファイルのプロパティを開き、「デジタル署名」および「製品バージョン」「著作権」等の情報を確認し、Inbox ドライバとして組み込まれたものなのかを確認してみてください。
あと、問題が発生しない Windows 2000 Server のレジストリに、この Upper Filter Driver が登録されてているかも、併せて確認してみてください。ちなみに、"Diskperf.sys" ファイルは絶対にまだ削除しないでください。
勝手に削除すると、システムが再起動出来なくなりますので、ご注意ください。 -
確認しました。
"Diskperf.sys" ファイルのプロパティですが、以下情報になっておりました。
会社名 Microsoft Corporation
製品名 Microsoft(R) Windows (R) 2000 Operating System上記から標準ドライバのように見えますが、MSと書かれていてもサードベンダ製という事があるのでしょうか。
また、他のW2Kサーバーを確認しましたが、全て(2台)とも「PartMgr Diskperf」となっていました。
※なぜかここ2週間安定しております。。。。ブルースクリーンを仕掛けたのに。。。
-
> 上記から標準ドライバのように見えますが、
> MSと書かれていてもサードベンダ製という事があるのでしょうか。バイナリ ファイルのプロパティ情報は、単にドライバのリソース ファイルにどう記述するか。。。ということだけなので、3rd ベンダー製ドライバであっても、"Microsoft Corporation" と表示させることは可能です。
(著作権的には問題ありますけど。)
なので、ファイル プロパティ情報の「会社名」や「製品名」だけでは、判断できないのです。
そのため、「デジタル署名」に関する確認をお願いした訳ですが。。。
もっとも、バイナリ ファイルのタイムスタンプが他の Inbox ドライバと同じなら、"DiskPerf.sys" も Inbox なのでしょうけど。
それに、他の Windows 2000 Server でも "DiskPerf.sys" が登録されてるのであれば、このドライバは関係無い可能性の方が高いですね。
話を混乱させてしまい、申しわけありませんでした。ところで、「2週間安定している」とのことですが、以前の発生頻度って、どのくらいだったのでしょうか? -
すみません。W2Kだからかプロパティ内のタブ等にデジタル署名の記載がありませんでした。
いえ、疑いの部分がクリアしないと解決しないので助かります。
以前は1~3日おきに「予期せぬシャットダウン」(落ちて起動する)していました。
それも1日に何回も発生しておりました。多い時には1日50回ログがあった日もありました。
15分の間に5回くらい再起動を繰り返し、30分後にまた連続して数回落ちるを繰り返し一日合計20~50回という感じです。
基本的には1日に数十回落ち、1日安定しまた落ちるみたいな感じです。
時間帯も昼もありますが、気持ち夜(深夜)が多いです。
先ほど確認したら、10月17日を最後に落ちていませんでした。
-
Windows 7 でも大丈夫です。
(わざわざ Windows 10 上で試す必要はありません。)
Windows 2000 の disk.sys や PartMgr.sys も、Windows 7 上で確認してみていただけますか?
あと、DiskPerf.sys ファイルのタイムスタンプも。
DiskPerf.sys のドライバだけデジタル署名がなく、かつファイルのタイムスタンプが他の Inbox ドライバと異なるのであれば、やっぱり怪しいかも。ちなみに。。。
他の Windows 2000 Server でも DiskPerf.sys が Upper Filter として登録されていたとのことですが、それら Server での disk.sys や PartMgr.sys 等のドライバのファイル バージョンやタイムスタンプは同じだったのでしょうか? -
HomeCloset様
ご協力ありがとうございます。
お馬鹿様
一応報告させて頂きます。
▼不具合のあるマシン(ファイル名/タイムスタンプ/バージョン)
diskperf / 2003.6.19 / 5.0.2195.6664
disk / 2003.6.19 / 5.0.2195.6655
partmgr/ 2003.6.19 / 5.0.2195.6655
⇒タイムスタンプは同じですが、バージョンが少し異なりました。
▼他マシン
diskperf / 2003.6.20 / 5.0.2195.6664
disk / 2003.6.20 / 5.0.2195.6655
partmgr/ 2003.6.20 / 5.0.2195.6655
⇒タイムスタンプは同じですが、バージョンが少し異なりました。
ファイルでの比較ではバージョンが少し異なりましたが、他正常に動作しているマシンも同様にバージョンが異なっていたので
基本的には問題ないのかと考えております。
また、デジタル署名も同様にすべてのファイルで閲覧出来ませんでした。
一先ずはBSOD待ちという事ですかね。。。。
-
「インターフェース/ポーリング設定」で「I/F#1でのエラーパケット送信を検出」「CPU#1使用率測定」「IPレベル動作監視」をONにして、
ポーリングをしたらトップの監視ログに正常と応答があったので動作していると思っています。
ダウン後はping応答異常の後にCPU使用率に重度障害が出たログまで確認しました。
すみません。温度測定の項目がなかったので、やっていません。むしろ出来るのでしょうか笑
もしくは、他にお詳しいフリーの監視ツールなどがあれば対応致します。
初歩的な質問で申し訳ないのですが、マザーボード・CPUの構成はどこから確認可能でしょうか。
やはりBIOSからでしょうか。その場合時間帯を見計らうので少しご時間を頂くかもしれません。
一応コンピュータのプロパティ情報は以下でした。
Intel(R) Pentium(R) 4 CPU 2.40GHz
AT/AT COMPATIBLE
すみませんが、宜しくお願い致します。
-