none
Обработка отказа в растянутом кластере RRS feed

  • Вопрос

  • Всем привет!

    Для изучения новшеств Windows Server 2016 развернул растянутый кластер из 4-х нод.

    Ноды, географически разнесены по разным ДЦ. В качестве наблюдателя используется общая папка в третьем ДЦ.

    После того, как настроил синхронную репликацию, стал проверять как обрабатывается отказ как одной ноды, так и всего ДЦ.

    Вот что заметил:

    При падении сразу двух нод в одном ДЦ, обработка отказа происходит нормально, диск из второго ДЦ меняет Repliation role с Destination на Source примерно за 2-3 минуты.

    Однако, при падении ноды владельца диска, довольно часто, переключение на вторую ноду в этом же ДЦ заканчивается ничем, а именно:

    У диска меняется владелец, однако диск находится в статусе Unknown

    

    При этом, репликация ожидаемо прекращается

    Я нашел обходное решение для этого случая - перевод диска сначала в Offline, а после сразу в Online - после чего репликация восстанавливается, начинается синхронизация логов транзакции.

    Не смотря на наличие workaround, эта проблема досаждает своим наличием.

    Вопрос в следующем, может кто сталкивался с такой проблемой и знает как ее забороть окончательно?

    17 апреля 2017 г. 8:05