none
Failover Cluster на базе Windows Server 2012: перестала работать динамическая миграция RRS feed

  • Вопрос

  • Здравствуйте. Имеется отказоустойчивый кластер из трех одинаковых серверов (node1, node2, node3) на базе Windows Server 2012. Кластер настроен, каждый сервер подключен к быстрому хранилищу SAS-кабелями. Перед установкой и настройкой кластера проведены все подготовительные мероприятия по рекомендациям Microsoft. У нас также приобретен весь пакет System Center 2012, настроен отдельный сервер VMM. Все нормально работало, отказоустойчивость была, мы неоднократно проверяли. Выделили отдельный IP адрес для кластера, создали запись DNS - CL1 и CL1U.

    Буквально вчера внезапно потух свет, после чего администратор (я) начал выключать все серверы. Несмотря на то, что ИБП смог бы выдержать и 20-30 минут, все же принял такое решение, т.к. находимся во Владивостоке (такое иногда случается и надолго). Успел отправить в Shutdown 2 из 3 серверов. Первый сервер забыл впопыхах отправить на выключение. Но когда вспомнил, сразу дали свет (прошло минут 10). Две из трех нод все еще выключаются, но первая нода работает, на нее мигрировали все виртуальные машины. Вроде все работает. Когда все выключилось, я включил остальные ноды. Но распределить вручную (мигрировать) их поровну по нодам у меня не получилось. Сработала только обычная миграция. В VMM выдает следующую ошибку:

     Ошибка (12700)
    VMM не удалось выполнить операцию с узлом на сервере NODE3.ххх.int из-за ошибки: Сбой операции миграции виртуальной машины для "ХХХХХ" в исходном расположении миграции "NODE3". (ИД виртуальной машины: F5907797-5592-4343-9EB3-BEAD67AB9B8D)

    Операция миграции виртуальной машины для "ХХХХХ" завершилась сбоем, так как изменить корневую папку данных конфигурации для кластеризованной виртуальной машины невозможно. (ИД виртуальной машины: F5907797-5592-4343-9EB3-BEAD67AB9B8D)
    Unknown error (0x8005)

    Рекомендуемое действие
    Устраните проблему с узлом и повторите операцию.

    Полез в консоль управления кластера. Там нашел только ошибку:

    Ресурсу сетевого имени "CL1U" кластера не удалось зарегистрировать одно или несколько связанных DNS-имен по следующей причине:
    Неверный дескриптор.

    Убедитесь, что сетевые адаптеры, связанные с зависимыми ресурсами IP-адресов, настроены для доступа хотя бы к одному DNS-серверу.

    Та же ошибка есть и про имя CL1. Связано это или нет с проблемой миграции? Больше ничего такого существенного в логи не пишется. Все необходимые пермиссии на ДНС и в кластере вроде как стоят. Статей и рекомендаций по настройке особо нигде нет, т.к. технология наверное еще не особо обкатана. Перезагрузка не помогла. Буду признателен за любую помощь. Live Migration очень нужна нашей организации. Если что-либо еще всплывет или вспомню, напишу ниже. Заранее спасибо.

    Забыл сообщить еще об одной ошибке в диспетчере серверов:

    Ошибка разрешения целевого компьютера Kerberos

    12 июля 2013 г. 11:45

Ответы

  • К сожалению, проблему мы не решили. Переустановили все ноды на Windows server 2012 R2, пересобрали кластер и смигрировали все машинки. Теперь кластер работает исправно. Все-таки, интересно, в чем же тогда была причина.  
    • Помечено в качестве ответа Denis DyagilevEditor 28 октября 2013 г. 12:04
    28 октября 2013 г. 11:47

Все ответы

  • Попробуйте в консоли кластера выполнить восстановление для кластерного имени — на уровне имени кластера выбрать Cluster Core Resources, Cluster Name, правой кнопкой мыши More Actions, Repair.

    15 июля 2013 г. 5:25
    Модератор
  • Т.к. это поле неактивно, я сначала нажимаю "отключить от сети". Затем нажимаю "восстановить". Получаю 3 ошибки:

    1. Код события 1196. Ресурсу сетевого имени "Имя кластера" кластера не удалось зарегистрировать одно или несколько связанных DNS-имен по следующей причине:
    Неверный дескриптор.

    Убедитесь, что сетевые адаптеры, связанные с зависимыми ресурсами IP-адресов, настроены для доступа хотя бы к одному DNS-серверу.

    2. Код события 1207. Не удалось обновить объект-компьютер, связанный с ресурсом сетевого имени кластера "Имя кластера", в домене "ххх.int" во время операции 
    Resource post online.

    Сообщение для связанного кода ошибки: Такой объект на сервере отсутствует.

     Возможно, удостоверение кластера "CL1$" не имеет разрешений, необходимых для обновления объекта. Обратитесь к администратору домена, чтобы убедиться, что удостоверение кластера может обновлять объекты-компьютеры в этом домене.

    3. тоже самое что и 1

    15 июля 2013 г. 5:45
  • Попробуйте узлам выдать права изменения пароля для кластерного имени.
    15 июля 2013 г. 6:13
    Модератор
  • Попробуйте узлам выдать права изменения пароля для кластерного имени.
    Доступ дан даже полный на все три ноды (имеется ввиду во вкладке "безопасность" свойств компьютера CL1, самого кластера)
    15 июля 2013 г. 6:29
  • Тема актуальна. Проблема не решена. 
    22 июля 2013 г. 3:33
  • Попробуйте установить исправление, описанное в KB2838043.
    23 июля 2013 г. 11:43
    Модератор
  • Попробуйте установить исправление, описанное в KB2838043.

    К сожалению, данная заплатка не помогла. 


    • Изменено Perekhoda Sergei 24 июля 2013 г. 23:48 пересобрать кластер не вариант
    24 июля 2013 г. 9:23
  • К сожалению, проблему мы не решили. Переустановили все ноды на Windows server 2012 R2, пересобрали кластер и смигрировали все машинки. Теперь кластер работает исправно. Все-таки, интересно, в чем же тогда была причина.  
    • Помечено в качестве ответа Denis DyagilevEditor 28 октября 2013 г. 12:04
    28 октября 2013 г. 11:47
  • Я у себя решил эту проблему

    1. Проверил  Ip на всех узлах и на кластере

    2. В оснастке отказоустойчивого кластера, уровень имени кластера, ресурсы ядра кластера,

    IP кластера отключил

    3. Там же, но в имени, дополнительные действия, восстановить

    вот и все


    • Изменено AG-V 13 ноября 2014 г. 10:08
    • Предложено в качестве ответа Stavross25 6 января 2017 г. 9:05
    13 ноября 2014 г. 10:07