none
Развалился кластер RRS feed

  • Общие обсуждения

  • Здраствуйте.

    У меня создан кластер на базе Windows 2003 SP2 R2 x64, кворумный диск и кластерные ресурсы лежат на SAN HP EVA 4400. Доступ к данным на хранилище происходит с использованием Microsoft MPIO. И все было хорошо пока я по технической необходимости не выключил обе ноды.

    После включения ноды1 (нода2 выключена) на ней не запустилась служба Cluster service (установлен автоматический режим запуска), а в журнале системы появилось два идущих подряд события 1034 (The disk associated with cluster disk resource 'Disk Q:' could not be found. The expected signature of the disk was AD6E8966. If the disk was removed from the server cluster, the resource should be deleted. If the disk was replaced, the resource must be deleted and created again in order to bring the disk online. If the disk has not been removed or replaced, it may be inaccessible at this time because it is reserved by another server cluster node.), а затем 1009 (Cluster service could not join an existing server cluster and could not form a new server cluster. Cluster service has terminated.) Второе, естественно, произошло потому что отвалился кворумный диск. В диспетчере дисков я обнаружил кворумный диск и диск с кластерными ресурами, но при попытки открыть эти диски в проводнике мне выдавалось сообщение, что устройство недоступно. Я решил, что проблема в ноде1, выключил ее и загрузил ноду2. Картина повторилась один в один: служба Cluster service не запустилась, в журнале системы ошибки 1034 и 1009 и "устройство не доступно" в проводнике.

    После бессонной ночи, во время которой совершались пляски с бубном и листания Гугла я поднял кластер. Сигнатуру диска заменил используя утилиту dumpcfg (узнал о ней отсюда http://support.microsoft.com/kb/280425). Потом, позже, нашел вот эту статью http://technet.microsoft.com/en-us/library/cc757627.aspx#BKMK_2 (пункт The Cluster service fails to start and generates an Event ID 1034 in the Event log after you replace a failed hard disk, or change drives for the quorum resource.)

    Спустя некоторое время мне пришлось еще раз выключить кластер и ситуация с "пропаданием диска" повторилась. Только теперь я был готов к этому и поднял кластер за 15 минут.

    После всех мытарств у меня возник вопрос. Есть ли какой-то способ один раз и навсегда сделать так чтобы эта проклятая сигнатура не менялась или чтобы ее изменение не разрушало кластер (отказ от многовариантного доступа к ресурсам SAN не рассматривается)?

    Заранее спасибо.

    10 марта 2009 г. 8:56

Все ответы