VMWareのゲストOS(WindowsServer2012)をドメインサーバーにしています。(プライマリ・セカンダリ構成)
先日、突然プライマリに繋がらなくなり、クライアントPCからプライマリ上の共有フォルダにアクセスできない、クライアントPCを再起動するとログインできない(ユーザー名とパスワードを入力してEnterを押すと、真っ黒の画面にマウスカーソルが表示されるのみ)、という状態に陥りました。
これが20時頃のことで、担当者が帰宅しており、プライマリのコンソール画面を確認できたのは、翌朝6時頃です。
プライマリのコンソール画面を見ると、タスクバーもアイコンもない画面の真ん中に、「レジストリポリシー適用中です」という文字が表示されていて、そのまま30分程待つと、デスクトップ画面が表示されたので、念のため手動で再起動しました。
その後、プライマリは正しく機能するようにはなったのですが、このような状態になった原因がわかりません。おそらく「レジストリポリシー適用中です」という表示になっていたことが、関係あるものとは思うのですが…
- 20時頃~6時過ぎ(手動再起動)の間に、自動でシャットダウンや再起動が行われたようなイベントログは、見当たりませんでした。
- イベントログ中、特に空白の時間帯もなく、目を引く警告やエラー等も無く、ただ例日通りに稼働し続けていただけに見えます。
- WindowsUpdateの更新履歴も、最新は半月ほど前のままでした。
- 同じVMWare上の他のゲストOSを使うサービスは、問題なく稼働していました。
また、現象発生前に以下のことが起こっています。
- 16時頃に停電がありました。但し建屋に副電源を備えているので、極々短時間をUPSで凌いだのみで、停止はしていません。
- 17-18時の間に、リモートデスクトップでプライマリに接続して作業をして、サインオフしています。
今回、冗長構成にしていたはずなのに働かず(?)、担当者不在で対応できず長時間業務が止まることになってしまったので、対策を打つ必要があり、原因を調査しています。
思い当たることがありましたら、ご助言いただけると幸いです。
(7/17追記)
接続ができなかった期間、該当サーバーのログで、SMBClientが頻繁にエラーを記録していたことがわかりました。
「Microsoft-Windows-SMBClient,30809,なし,"サーバーからの応答がなかったため、要求がタイムアウトしました。」
原因ではなく、結果のひとつだとは思いますが…