none
Недостпно управление кластером RRS feed

  • Вопрос

  • Имеется кластер Hyper-V на Windows Sever 2012 R2 Datacenter Cluster.domain.local

    Состоит из двух серверов FC1 и FC2 и СХД.

    После краха и восстановления контроллера домена domain.local и его DNS-сервера стало невозможным управлять кластером через оснастку.

    FС1 кластера был перенесён в новый домен domain.loc для того чтобы там работали виртуальные машины пока я разбираюсь со вторым узлом.

    FC2 остался на месте, но после перезагрузки сервера, он потерял подключения к хранилищу, а диспетчер кластеров пишет что кластер не готов.

    До перезагрузки был сделан лог проверки:

    https://yadi.sk/i/tXq6nMQ3nudE4

    29 января 2016 г. 6:23

Ответы

  • Там нет никакого особого порядка действий. Вам нужно только аккуратно перевести ВМ из кластерного в некластерный статус.

    Если есть место на СХД, то создайте там новый том, подключите его к одному из серверов как некластерный (с буквой диска) и мигрируйте ВМ на этот диск, чтобы преобразовать их в локальный ресурс. Потом уберите из кластера все CSV и ликвидируйте кластер путем вывода из него обеих нод. Затем создайте кластер заново, подключите к нему CSV-тома, мигрируйте обратно на них ВМ и преобразуйте их в кластерные ресурсы. Процедура долгая и требующая лишних ресурсов, но зато абсолютно безопасная и не прерывающая работу ВМ.

    Если лишнего места нет, удалите ВМ и их файлы конфигурации (без удаления файлов дисков!), разберите кластер, создайте заново, подключите тома обратно и заново создайте ВМ на базе сохраненных файлов жестких дисков. Но здесь вы получите даунтайм на время создания и тестирования нового кластера плюс потенциальную возможность угробить ВМ целиком из-за случайных ошибок при работе с томами и виртуальными жесткими дисками.


    Evgeniy Lotosh // MCSE: Server infrastructure, MCSE: Messaging

    3 февраля 2016 г. 7:26

Все ответы

  • Я не понял, что именно вы сделали. Что означает "FС1 кластера был перенесён в новый домен"?  Начиная с Server 2008 операция переноса кластера (и, как следствие, его отдельных узлов) между доменами не поддерживается ( https://support.microsoft.com/en-us/kb/269196 ).

    "FC2 остался на месте, но после перезагрузки сервера, он потерял подключения к хранилищу" - что именно это означает? Физическая утрата доступа (линки в дауне, сервер не видит таргеты на СХД) или что? В Device Manager и Disk Management тома на СХД видны, операции с ними возможны?

    Также опишите тип кворума в кластере. И процитируйте здесь не то, что пишет управляющая консоль, а сообщения об ошибках в системном журнале (ПОЛНОСТЬЮ, с источником и кодом).

    Пока что методом ясновидения можно предположить, что после "переноса FC1" узел FC2 банально потерял доступ как к кворуму, так и к партнеру, оставшись в меньшинстве, из-за чего кластерная служба там не запускается в строгом соответствии с правилами разруливания конфликтов в кластере.


    Evgeniy Lotosh // MCSE: Server infrastructure, MCSE: Messaging

    29 января 2016 г. 6:47
  • Я не понял, что именно вы сделали. Что означает "FС1 кластера был перенесён в новый домен"?  Начиная с Server 2008 операция переноса кластера (и, как следствие, его отдельных узлов) между доменами не поддерживается ( https://support.microsoft.com/en-us/kb/269196 ).

    "FC2 остался на месте, но после перезагрузки сервера, он потерял подключения к хранилищу" - что именно это означает? Физическая утрата доступа (линки в дауне, сервер не видит таргеты на СХД) или что? В Device Manager и Disk Management тома на СХД видны, операции с ними возможны?

    Также опишите тип кворума в кластере. И процитируйте здесь не то, что пишет управляющая консоль, а сообщения об ошибках в системном журнале (ПОЛНОСТЬЮ, с источником и кодом).

    Пока что методом ясновидения можно предположить, что после "переноса FC1" узел FC2 банально потерял доступ как к кворуму, так и к партнеру, оставшись в меньшинстве, из-за чего кластерная служба там не запускается в строгом соответствии с правилами разруливания конфликтов в кластере.


    Evgeniy Lotosh // MCSE: Server infrastructure, MCSE: Messaging

    Вот всё так как Вы описали. Значит правильно я всё написал. Да натворил делов.

    Про невозможность переноса в другой домен узнал поздно. Может вернуть его обратно в свой домен? Теперь он доступен и работает.

    Значит это является причиной всех бед:

    "Пока что методом ясновидения можно предположить, что после "переноса FC1" узел FC2 банально потерял доступ как к кворуму, так и к партнеру, оставшись в меньшинстве, из-за чего кластерная служба там не запускается в строгом соответствии с правилами разруливания конфликтов в кластере."

    Вопрос как решить этот сделанный мной бардак?

    29 января 2016 г. 7:36
  • Две ошибки такие:

    Имя журнала:   System
    Источник:      Microsoft-Windows-FailoverClustering
    Дата:          29.01.2016 10:39:10
    Код события:   1573
    Категория задачи:Диспетчер кворума
    Уровень:       Ошибка
    Ключевые слова:
    Пользователь:  СИСТЕМА
    Компьютер:     FC2.DOMAIN.local
    Описание:
    Узлу "FC2" не удалось создать кластер. Причина - недоступность ресурса-свидетеля. Убедитесь, что ресурс-свидетель подключен и доступен.
    Xml события:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" />
        <EventID>1573</EventID>
        <Version>0</Version>
        <Level>2</Level>
        <Task>42</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2016-01-29T07:39:10.142356200Z" />
        <EventRecordID>243454</EventRecordID>
        <Correlation />
        <Execution ProcessID="3032" ThreadID="180" />
        <Channel>System</Channel>
        <Computer>FC2.DOMAIN.local</Computer>
        <Security UserID="S-1-5-18" />
      </System>
      <EventData>
        <Data Name="NodeName">FC2</Data>
      </EventData>
    </Event>

    Имя журнала:   System
    Источник:      Microsoft-Windows-FailoverClustering
    Дата:          29.01.2016 10:39:10
    Код события:   1653
    Категория задачи:Подключения между узлами
    Уровень:       Ошибка
    Ключевые слова:
    Пользователь:  СИСТЕМА
    Компьютер:     FC2.DOMAIN.local
    Описание:
    Узлу кластера FC2не удалось подключиться к кластеру из-за невозможности установить сетевую связь с каким-либо другим узлом в кластере. Проверьте сетевое подключение и настройки сетевых брандмауэров.
    Xml события:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" />
        <EventID>1653</EventID>
        <Version>1</Version>
        <Level>2</Level>
        <Task>43</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2016-01-29T07:39:10.142356200Z" />
        <EventRecordID>243455</EventRecordID>
        <Correlation />
        <Execution ProcessID="3032" ThreadID="180" />
        <Channel>System</Channel>
        <Computer>FC2.DOMAIN.local</Computer>
        <Security UserID="S-1-5-18" />
      </System>
      <EventData>
        <Data Name="NodeName">FC2</Data>
      </EventData>
    </Event>

    29 января 2016 г. 7:44
  • Да, сообщения об ошибках подтверждают мою гипотезу. Я не уверен, поможет ли возвращение FC1 обратно в старый домен, но попробовать можно.

    Однако же зачем вам кластерная служба на старом сервере? Не проще ли убрать старый кластер в старом домене и просто подключить сервер FC2 к тем томам на СХД, с которыми он должен работать? Какие кластерные ресурсы вы пытаетесь оживить?

    В предположении, что ваши ресурсы - виртуальные машины, ваш план действий таков:

    • Удалить кластер;
    • Подмонтировать все тома с ВМ к серверу как обычные внешние диски;
    • Заново создать все виртуальные машины, добавив к ним виртуальные диски старых машин.

    Последнее приведет к созданию нового "аппаратного окружения" внутри ВМ, которое Винда при первом включении распознает и инсталлирует заново. Единственная проблема здесь - у вас в ОС исчезнут старые и появятся новые сетевые карты, на которых заново придется сконфигурировать старые IP-адреса.


    Evgeniy Lotosh // MCSE: Server infrastructure, MCSE: Messaging

    29 января 2016 г. 9:10
  • Две ошибки такие:

    Имя журнала:   System
    Источник:      Microsoft-Windows-FailoverClustering
    Дата:          29.01.2016 10:39:10
    Код события:   1573
    Категория задачи:Диспетчер кворума
    Уровень:       Ошибка
    Ключевые слова:
    Пользователь:  СИСТЕМА
    Компьютер:     FC2.DOMAIN.local
    Описание:
    Узлу "FC2" не удалось создать кластер. Причина - недоступность ресурса-свидетеля. Убедитесь, что ресурс-свидетель подключен и доступен.
    Xml события:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" />
        <EventID>1573</EventID>
        <Version>0</Version>
        <Level>2</Level>
        <Task>42</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2016-01-29T07:39:10.142356200Z" />
        <EventRecordID>243454</EventRecordID>
        <Correlation />
        <Execution ProcessID="3032" ThreadID="180" />
        <Channel>System</Channel>
        <Computer>FC2.DOMAIN.local</Computer>
        <Security UserID="S-1-5-18" />
      </System>
      <EventData>
        <Data Name="NodeName">FC2</Data>
      </EventData>
    </Event>

    Имя журнала:   System
    Источник:      Microsoft-Windows-FailoverClustering
    Дата:          29.01.2016 10:39:10
    Код события:   1653
    Категория задачи:Подключения между узлами
    Уровень:       Ошибка
    Ключевые слова:
    Пользователь:  СИСТЕМА
    Компьютер:     FC2.DOMAIN.local
    Описание:
    Узлу кластера FC2не удалось подключиться к кластеру из-за невозможности установить сетевую связь с каким-либо другим узлом в кластере. Проверьте сетевое подключение и настройки сетевых брандмауэров.
    Xml события:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" />
        <EventID>1653</EventID>
        <Version>1</Version>
        <Level>2</Level>
        <Task>43</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2016-01-29T07:39:10.142356200Z" />
        <EventRecordID>243455</EventRecordID>
        <Correlation />
        <Execution ProcessID="3032" ThreadID="180" />
        <Channel>System</Channel>
        <Computer>FC2.DOMAIN.local</Computer>
        <Security UserID="S-1-5-18" />
      </System>
      <EventData>
        <Data Name="NodeName">FC2</Data>
      </EventData>
    </Event>


    Да у вас сейчас просто кворума нет - причём тут домен? Разбирайтесь с ресурсом-свидетелем (что это - диск или общая папка - это зависит от того, как был настроен кворум).

    Слава России!

    29 января 2016 г. 10:36
  • Да, сообщения об ошибках подтверждают мою гипотезу. Я не уверен, поможет ли возвращение FC1 обратно в старый домен, но попробовать можно.

    Однако же зачем вам кластерная служба на старом сервере? Не проще ли убрать старый кластер в старом домене и просто подключить сервер FC2 к тем томам на СХД, с которыми он должен работать? Какие кластерные ресурсы вы пытаетесь оживить?

    В предположении, что ваши ресурсы - виртуальные машины, ваш план действий таков:

    • Удалить кластер;
    • Подмонтировать все тома с ВМ к серверу как обычные внешние диски;
    • Заново создать все виртуальные машины, добавив к ним виртуальные диски старых машин.

    Последнее приведет к созданию нового "аппаратного окружения" внутри ВМ, которое Винда при первом включении распознает и инсталлирует заново. Единственная проблема здесь - у вас в ОС исчезнут старые и появятся новые сетевые карты, на которых заново придется сконфигурировать старые IP-адреса.


    Evgeniy Lotosh // MCSE: Server infrastructure, MCSE: Messaging

    Краткое содержание предыдущих серий.

    Вообще-то, новый домен появился как обходное решение проблемы неработоспособности старого домена (и отчаяния решить проблему с его рабтоспособностью). Однако проблема со старым доменом таки была решена и теперь в качестве структурного решения автору вопроса нужен, скорее, старый домен и старый кластер. 

    Подробности - в этом обсуждении: https://social.technet.microsoft.com/Forums/ru-RU/f238b0cd-f459-4c68-a5ae-84bf21cb8676/-?forum=WS8ru


    Слава России!

    29 января 2016 г. 10:43

  • Вообще-то, новый домен появился как обходное решение проблемы неработоспособности старого домена (и отчаяния решить проблему с его рабтоспособностью).

    Понятно. Ну, ждем отчета ТС о том, получилось ли вернуть хост в старый домен. Интересный получится эксперимент на живой инфраструктуре...

    Evgeniy Lotosh // MCSE: Server infrastructure, MCSE: Messaging

    29 января 2016 г. 10:58
  • Ну, в новый домен-то он его уже переводил, так что ничего интересного.


    Слава России!

    29 января 2016 г. 11:11

  • Да у вас сейчас просто кворума нет - причём тут домен? Разбирайтесь с ресурсом-свидетелем (что это - диск или общая папка - это зависит от того, как был настроен кворум).

    Слава России!

    Кворум это диск на СХД
    29 января 2016 г. 12:17
  • И в старом кластере, и в новом? И один и тот же диск?

    Тогда не удивительно, что кворума для старого кластера нет - его захватил узел нового кластера.


    Слава России!

    29 января 2016 г. 12:25
  • И в старом кластере, и в новом? И один и тот же диск?

    Тогда не удивительно, что кворума для старого кластера нет - его захватил узел нового кластера.


    Слава России!

    Т.е. переведя FC1 в новый домен он стал новым кластером?

    29 января 2016 г. 13:23
  • Честно говоря, без использования телепатии не могу сказать, что именно там у вас произошло. Но узлы кластера должны находиться в одном домене. А стал ли у вас FC1 кластером или просто зарезервировал диск без запуска службы кластера - это я сказать не могу.


    Слава России!

    29 января 2016 г. 13:26
  • Честно говоря, без использования телепатии не могу сказать, что именно там у вас произошло. Но узлы кластера должны находиться в одном домене. А стал ли у вас FC1 кластером или просто зарезервировал диск без запуска службы кластера - это я сказать не могу.


    Слава России!

    Пока сам так же не понимаю что и где и как это работает.

    Случилось вот что:

    Добавил к сетевой карте старый DNS от старого домена DOMAIN.local

    Добавил в новый домен (domain.loc) все учётные записи кластера которые были в старом домене.

    Прописал в новом DNS записи A для имён кластера. (их там три CAUFC_wms, FC_Cluster_V, FC_Cluster).

    И Ваша телепатия работает.

    Проблема именно в том что FC1 стал "новым кластером" и захватил все ресурсы, оставив FC2 ни с чем.

    В итоге я смог подключиться к кластеру с помощью диспетчера.

    Ошибки следующие:

    Узел FC2 не работает. (может его перенести в новый домен и станет доступным?)

    Все роли работают и доступны для управления.

    • Изменено AiratOS 29 января 2016 г. 15:04
    29 января 2016 г. 14:39
  • Сыпятся вот такие ошибки:

    Имя журнала:   System
    Источник:      Microsoft-Windows-FailoverClustering
    Дата:          29.01.2016 18:10:13
    Код события:   1196
    Категория задачи:Ресурс "Сетевое имя"
    Уровень:       Ошибка
    Ключевые слова:
    Пользователь:  СИСТЕМА
    Компьютер:     FC1.DOMAIN.loc
    Описание:
    Ресурсу сетевого имени "FC_Cluster_V" кластера не удалось зарегистрировать одно или несколько связанных DNS-имен по следующей причине:
    Неверный дескриптор.
    .

    Убедитесь, что сетевые адаптеры, связанные с зависимыми ресурсами IP-адресов, настроены для доступа хотя бы к одному DNS-серверу.
    Xml события:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" />
        <EventID>1196</EventID>
        <Version>0</Version>
        <Level>2</Level>
        <Task>19</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2016-01-29T15:10:13.635010900Z" />
        <EventRecordID>229076</EventRecordID>
        <Correlation />
        <Execution ProcessID="4084" ThreadID="2500" />
        <Channel>System</Channel>
        <Computer>FC1.DOMAIN.loc</Computer>
        <Security UserID="S-1-5-18" />
      </System>
      <EventData>
        <Data Name="ResourceName">FC_Cluster_V</Data>
        <Data Name="StatusString">Неверный дескриптор.
    </Data>
      </EventData>
    </Event>

    Имя журнала:   System
    Источник:      Microsoft-Windows-FailoverClustering
    Дата:          29.01.2016 17:55:48
    Код события:   1196
    Категория задачи:Ресурс "Сетевое имя"
    Уровень:       Ошибка
    Ключевые слова:
    Пользователь:  СИСТЕМА
    Компьютер:     FC1.DOMAIN.loc
    Описание:
    Ресурсу сетевого имени "CAUFC_wms" кластера не удалось зарегистрировать одно или несколько связанных DNS-имен по следующей причине:
    Неверный дескриптор.
    .

    Убедитесь, что сетевые адаптеры, связанные с зависимыми ресурсами IP-адресов, настроены для доступа хотя бы к одному DNS-серверу.
    Xml события:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" />
        <EventID>1196</EventID>
        <Version>0</Version>
        <Level>2</Level>
        <Task>19</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2016-01-29T14:55:48.497111500Z" />
        <EventRecordID>229074</EventRecordID>
        <Correlation />
        <Execution ProcessID="4016" ThreadID="4972" />
        <Channel>System</Channel>
        <Computer>FC1.DOMAIN.loc</Computer>
        <Security UserID="S-1-5-18" />
      </System>
      <EventData>
        <Data Name="ResourceName">CAUFC_wms</Data>
        <Data Name="StatusString">Неверный дескриптор.
    </Data>
      </EventData>
    </Event>

    Имя журнала:   System
    Источник:      Microsoft-Windows-FailoverClustering
    Дата:          29.01.2016 17:55:27
    Код события:   1196
    Категория задачи:Ресурс "Сетевое имя"
    Уровень:       Ошибка
    Ключевые слова:
    Пользователь:  СИСТЕМА
    Компьютер:     FC1.DOMAIN.loc
    Описание:
    Ресурсу сетевого имени "Имя кластера" кластера не удалось зарегистрировать одно или несколько связанных DNS-имен по следующей причине:
    Неверный дескриптор.
    .

    Убедитесь, что сетевые адаптеры, связанные с зависимыми ресурсами IP-адресов, настроены для доступа хотя бы к одному DNS-серверу.
    Xml события:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" />
        <EventID>1196</EventID>
        <Version>0</Version>
        <Level>2</Level>
        <Task>19</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2016-01-29T14:55:27.132874800Z" />
        <EventRecordID>229073</EventRecordID>
        <Correlation />
        <Execution ProcessID="4084" ThreadID="2500" />
        <Channel>System</Channel>
        <Computer>FC1.DOMAIN.loc</Computer>
        <Security UserID="S-1-5-18" />
      </System>
      <EventData>
        <Data Name="ResourceName">Имя кластера</Data>
        <Data Name="StatusString">Неверный дескриптор.
    </Data>
      </EventData>
    </Event>

    Имя журнала:   System
    Источник:      Microsoft-Windows-FailoverClustering
    Дата:          29.01.2016 17:21:03
    Код события:   1254
    Категория задачи:Диспетчер ресурсов
    Уровень:       Ошибка
    Ключевые слова:
    Пользователь:  СИСТЕМА
    Компьютер:     FC1.DOMAIN.loc
    Описание:
    Кластерная роль "FC_Cluster_V" превысила порог отработки отказа. Настроенное количество попыток отработки отказа в течение выделенного времени на отработку исчерпано и будет оставлено состояние сбоя. Дополнительные попытки по подключению роли к сети или переводу на другой узел в кластере предприниматься не будут. Проверьте события, связанные со сбоем. После устранения причин, вызвавших сбой, роль можно подключить к сети вручную либо такую попытку может выполнить кластер по истечении периода задержки перезагрузки.
    Xml события:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" />
        <EventID>1254</EventID>
        <Version>0</Version>
        <Level>2</Level>
        <Task>3</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2016-01-29T14:21:03.020710700Z" />
        <EventRecordID>229053</EventRecordID>
        <Correlation />
        <Execution ProcessID="1912" ThreadID="6424" />
        <Channel>System</Channel>
        <Computer>FC1.DOMAIN.loc</Computer>
        <Security UserID="S-1-5-18" />
      </System>
      <EventData>
        <Data Name="ResourceGroup">FC_Cluster_V</Data>
      </EventData>
    </Event>

    Имя журнала:   System
    Источник:      Microsoft-Windows-FailoverClustering
    Дата:          29.01.2016 17:21:03
    Код события:   1205
    Категория задачи:Диспетчер ресурсов
    Уровень:       Ошибка
    Ключевые слова:
    Пользователь:  СИСТЕМА
    Компьютер:     FC1.DOMAIN.loc
    Описание:
    Службе кластеров не удалось полностью перевести кластерную роль "FC_Cluster_V" в автономный или оперативный режим. Возможно, один или несколько ресурсов находятся в неисправном состоянии. Это может влиять на доступность кластерной роли.
    Xml события:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" />
        <EventID>1205</EventID>
        <Version>0</Version>
        <Level>2</Level>
        <Task>3</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2016-01-29T14:21:03.020710700Z" />
        <EventRecordID>229052</EventRecordID>
        <Correlation />
        <Execution ProcessID="1912" ThreadID="6424" />
        <Channel>System</Channel>
        <Computer>FC1.DOMAIN.loc</Computer>
        <Security UserID="S-1-5-18" />
      </System>
      <EventData>
        <Data Name="ResourceGroup">FC_Cluster_V</Data>
      </EventData>
    </Event>

    Имя журнала:   System
    Источник:      Microsoft-Windows-FailoverClustering
    Дата:          29.01.2016 17:21:03
    Код события:   1069
    Категория задачи:Диспетчер ресурсов
    Уровень:       Ошибка
    Ключевые слова:
    Пользователь:  СИСТЕМА
    Компьютер:     FC1.DOMAIN.loc
    Описание:
    Сбой ресурса кластера "Брокер реплики Hyper-V FC_Cluster_V" с типом "Virtual Machine Replication Broker" в кластерной роли "FC_Cluster_V".

    В зависимости от политик на случай сбоя ресурса и роли служба кластеров может попытаться подключить ресурс на этом узле или же переместить группу на другой узел кластера, а затем перезапустить ее. Проверьте состояние ресурса и группы с помощью диспетчера отказоустойчивости кластеров или командлета Get-ClusterResource оболочки Windows PowerShell.
    Xml события:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" />
        <EventID>1069</EventID>
        <Version>1</Version>
        <Level>2</Level>
        <Task>3</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2016-01-29T14:21:03.020710700Z" />
        <EventRecordID>229051</EventRecordID>
        <Correlation />
        <Execution ProcessID="1912" ThreadID="6424" />
        <Channel>System</Channel>
        <Computer>FC1.DOMAIN.loc</Computer>
        <Security UserID="S-1-5-18" />
      </System>
      <EventData>
        <Data Name="ResourceName">Брокер реплики Hyper-V FC_Cluster_V</Data>
        <Data Name="ResourceGroup">FC_Cluster_V</Data>
        <Data Name="ResTypeDll">Virtual Machine Replication Broker</Data>
      </EventData>
    </Event>

    • Изменено AiratOS 29 января 2016 г. 15:18
    29 января 2016 г. 15:17
  • AiratOS, у вас одна простыня два раза отправлена. Удалите одну из них, читать сложно.

    Эти ошибки указывают ровно на то, что в них написано: служба кластера не может зарегистрировать в DNS имя кластера. Объясните, что вы сделали и каково текущее состояние дел.

    Если вы вернули первый сервер в старый домен, то убедитесь, что на его интерфейсах прописаны только IP-адреса контроллеров старого домена в качестве DNS-серверов. Также вручную удалите из зоны DNS имя кластера, если оно там сейчас есть - если дело в разрешениях на ней, она будет пересоздана службой кластера с нужными правами доступа.


    Evgeniy Lotosh // MCSE: Server infrastructure, MCSE: Messaging

    1 февраля 2016 г. 5:37
  • Сейчас у меня такое положение дел:

    1.два DNS сервера DNS_old и DNS_new

    2.Два домена DOMAIN.local и DOMAIN.loc

    3.Кластер создан в DOMAIN.local

    4.узел FC1 в новом домене и я так понял он захватил все ресурсы кластера. После этого к кластеру можно подключиться с помощью диспетчера. Так и оставил не переносил обратно.

    5.узел FC2 оставил в старом домене, он за бортом. Пока не переносил в новый домен.

    Что я сделал:

    1. Прописал в DNS_new имя кластера, брокера реплики.

    2. Создал учётную запись компьютера с именем кластера, брокера реплики в DOMAIN.loc.

    Положение дел:

    0. Кластер находится в оперативном режиме.

    1. Брокер реплики пишет сбой.

    В журнале события каждые 5 минут.

    1.1. Ресурсу сетевого имени "FC_Cluster_V" кластера не удалось зарегистрировать одно или несколько связанных DNS-имен по следующей причине:
    Неверный дескриптор.

    1.2."Брокер реплики Hyper-V FC_Cluster_V": не удалось зарегистрировать имя субъекта-службы. Неверное имя пользователя или пароль. (0x8007052E).

    1.3.Сбой ресурса кластера "Брокер реплики Hyper-V FC_Cluster_V" с типом "Virtual Machine Replication Broker" в кластерной роли "FC_Cluster_V".

    2. На обоих интерфейсах узла FC1 прописан DNS_new как основной и DNS_old как резервный.


    • Изменено AiratOS 1 февраля 2016 г. 7:13
    1 февраля 2016 г. 7:12
  • Что я сделал:

    1. Прописал в DNS_new имя кластера, брокера реплики.


    Ну, собственно, вот и корень проблемы с сообщениями. Вы создали запись в DNS вручную, тем самым дав права на ее изменение только себе. Кластерная служба пытается ее обновить и получает отказ из-за нехватки прав.

    Ошибка в данном контексте чисто косметическая. Самый простой способ ее исправить - просто удалите из DNS эту запись. Кластерная служба ее зарегистрирует сама.


    Evgeniy Lotosh // MCSE: Server infrastructure, MCSE: Messaging

    1 февраля 2016 г. 7:51
  • Там их три записи:

    FC_Cluster_V - брокер реплики.

    FC_Cluster - имя кластера я так понимаю

    CAUFC_wms - не знаю что за запись.

    Удалить все записи?

    1 февраля 2016 г. 9:10
  • Там их три записи:

    FC_Cluster_V - брокер реплики.

    FC_Cluster - имя кластера я так понимаю

    CAUFC_wms - не знаю что за запись.

    Удалить все записи?

    FC_Cluster - да, удалить. FC_Cluster_V - не уверен, но тоже лучше удалить (создать заново всегда можно). Насчет третьй записи - не знаю, что это. Пока не трогайте.

    Evgeniy Lotosh // MCSE: Server infrastructure, MCSE: Messaging

    1 февраля 2016 г. 9:25
  • Описания учётных записей в АД DOMAIN.local созданных кластером в начале его жизни:

    CAUFC_wms - Failover cluster virtual network name account

    FC_Cluster - Учетная запись виртуального имени отказоустойчивого кластера

    FC_Cluster_V - Failover cluster virtual network name account (в оснастке MMC это роль с типом брокера реплики Hyper-V)

    Всё удалил конечно, но ошибки те же по всем трём учёткам:

    Имя журнала:   System
    Источник:      Microsoft-Windows-FailoverClustering
    Дата:          01.02.2016 12:35:49
    Код события:   1196
    Категория задачи:Ресурс "Сетевое имя"
    Уровень:       Ошибка
    Ключевые слова:
    Пользователь:  СИСТЕМА
    Компьютер:     FC1.DOMAIN.loc
    Описание:
    Ресурсу сетевого имени "Имя кластера" кластера не удалось зарегистрировать одно или несколько связанных DNS-имен по следующей причине:
    Неверный дескриптор.
    .

    Убедитесь, что сетевые адаптеры, связанные с зависимыми ресурсами IP-адресов, настроены для доступа хотя бы к одному DNS-серверу.
    Xml события:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-FailoverClustering" Guid="{BAF908EA-3421-4CA9-9B84-6689B8C6F85F}" />
        <EventID>1196</EventID>
        <Version>0</Version>
        <Level>2</Level>
        <Task>19</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2016-02-01T09:35:49.423713600Z" />
        <EventRecordID>230442</EventRecordID>
        <Correlation />
        <Execution ProcessID="4084" ThreadID="148" />
        <Channel>System</Channel>
        <Computer>FC1.DOMAIN.loc</Computer>
        <Security UserID="S-1-5-18" />
      </System>
      <EventData>
        <Data Name="ResourceName">Имя кластера</Data>
        <Data Name="StatusString">Неверный дескриптор.
    </Data>
      </EventData>
    </Event>

    • Изменено AiratOS 1 февраля 2016 г. 9:49
    1 февраля 2016 г. 9:45
  • А что с адресами DNS-серверов на интерфейсах? Их вы поменяли на правильные?

    Кстати, динамическая регистрация в домене вообще работает? Запустите ipconfig /registerdns на обоих серверах кластера и посмотрите, что появится в системных логах в течение десяти-пятнадцати минут - сообщение об успехе или неудаче.


    Evgeniy Lotosh // MCSE: Server infrastructure, MCSE: Messaging

    1 февраля 2016 г. 11:46
  • Да DNS_new сервер стоит единственный на всех интерфейсах узла FC1.

    Ошибки те же. У меня подозрения что учётным записям кластера, брокера реплики не хватает разрешений.

    2 февраля 2016 г. 14:05
  • Регистрировать с нуля новые записи в DNS может любой компьютер домена. Если этого не происходит, то, возможно, у кластерной службы и в самом деле возникают проблемы с аутентификацией. Можно, конечно, смотреть журналы системы и безопасности на серверах на предмет сбоев при доступе к домену, но... С учетом того, что вы делали то, что формально не поддерживается, и никто не знает, что и как покривело в настройках, на вашем месте я бы просто разобрал кластер и собрал его заново. Быстрее будет.

    Evgeniy Lotosh // MCSE: Server infrastructure, MCSE: Messaging

    3 февраля 2016 г. 5:33
  • Да согласен.

    Тогда прошу кластерных ГУРУ подсказать правильный порядок действий.

    3 февраля 2016 г. 6:13
  • Там нет никакого особого порядка действий. Вам нужно только аккуратно перевести ВМ из кластерного в некластерный статус.

    Если есть место на СХД, то создайте там новый том, подключите его к одному из серверов как некластерный (с буквой диска) и мигрируйте ВМ на этот диск, чтобы преобразовать их в локальный ресурс. Потом уберите из кластера все CSV и ликвидируйте кластер путем вывода из него обеих нод. Затем создайте кластер заново, подключите к нему CSV-тома, мигрируйте обратно на них ВМ и преобразуйте их в кластерные ресурсы. Процедура долгая и требующая лишних ресурсов, но зато абсолютно безопасная и не прерывающая работу ВМ.

    Если лишнего места нет, удалите ВМ и их файлы конфигурации (без удаления файлов дисков!), разберите кластер, создайте заново, подключите тома обратно и заново создайте ВМ на базе сохраненных файлов жестких дисков. Но здесь вы получите даунтайм на время создания и тестирования нового кластера плюс потенциальную возможность угробить ВМ целиком из-за случайных ошибок при работе с томами и виртуальными жесткими дисками.


    Evgeniy Lotosh // MCSE: Server infrastructure, MCSE: Messaging

    3 февраля 2016 г. 7:26