none
Hyper-V Failover Cluster – VMs estão reiniciando quando um dos HOSTs falham RRS feed

  • Pergunta

  • Olá, boa tarde!

    Eu montei um Failover Cluster com dois servidores Hyper-V 2012 R2, eu consigo fazer o Live Migration normalmente entre os HOSTs Hyper-V, mas no momento que Eu faço uma simulação de falha, do tipo desconectar a placa de rede de um dos HOSTs, as maquinas virtuais são movidas para o HOST disponível, mas as maquinas virtuais são desligadas e quando elas aparecem no outro HOST, eles estão em estado de inicialização e depois que as VMs terminam suas inicializações o sistema operacional delas (VMs) retornam “Shutdown Event Tracker”. 

    Como Eu faço para impedir que as VMs sejam desligadas no caso da falha de um dos “Nodes” do meu Cluster?

    Cenário:
    2 Servidores com Microsoft Hyper-V R2
    1 Servidor com Windows Server 2012 R2 Standard (Instalação Server Core) – Servidor com iSCSI Target Server Instalado, com dois discos, um de 80GB e o outro de 500GB.
    Sistema Operacional foi instalado no disco de 80gb.

    Foram configurados:
    iSCSIVirtualDisk chamado CLUSTER-01.vhdx, foi armazenado no disco de 500GB usando o espaço total
    iSCSIVirtualDisk chamado QUORUM.vhdx foi armazenado no disco de 80GB usando 8gb de armazenamento.
    Os discos iSCSIVirtualDisks foram conectados em ambos servidores Hyper-V através do iSCSI Initiator.
    Foi feita a validação é a criação do Cluster.

    Storage – Disk:
    Cluster Disk 1 (CLUSTER-01.vhdx) foi habilitado o Cluster Shared Volume
    Cluster Disk 2 (QUORUM.vhdx) Disco de Testemunho e Quorum.

    • Editado Astequio quinta-feira, 19 de março de 2015 19:56
    quinta-feira, 19 de março de 2015 19:54

Respostas

  • http://blogs.msdn.com/b/virtual_pc_guy/archive/2014/01/10/virtual-machine-stop-action-in-a-cluster.aspx

    https://social.technet.microsoft.com/Forums/windowsserver/en-US/00fd73b0-a62d-4b97-a59e-e672498b1865/is-fault-tolerance-possible-with-hyperv-server-2012



    Se quiser derrubar uma árvore na metade do tempo, passe o dobro do tempo amolando o machado.

    • Marcado como Resposta Astequio terça-feira, 24 de março de 2015 13:10
    domingo, 22 de março de 2015 20:39
  • Olá Astequio,

    Pelo que entendi:

    Puxar o cabo de rede de um dos hosts ou até mesmo puxar o cabo de energia (Não Recomendado), não é uma forma planejada de failover para o sistema. Resumindo, o sistema não consegue descobrir quando a sua energia irá acabar ou no caso, quando você irá puxar o cabo de rede. Fazendo com que as máquinas virtuais desliguem repentinamente e religuem no outro servidor. O que a o sistema de failover clustering consegue saber é que um dos nós perdeu o contato.

    No caso do Live Migration ou até mesmo do Pause, considera-se um "failover planejado" pois vocês está informando o sistema que irá fazer isso, fazendo com que ele mova as máquinas antes mesmo do host se desligar.

    Espero ter ajudado!


    João Henrique Mortati Fuzinelli MCSA, MCP, MCTS

    • Marcado como Resposta Astequio terça-feira, 24 de março de 2015 13:10
    segunda-feira, 23 de março de 2015 16:50
  • Bom dia. Conforme as dicas do Felipe a Alta disponibilidade é exatamente pra suprir no caso de queda de um dos nós. Tenho ambientes configurados em cluster onde é efetuado a movimentação das VM's onde o Sistema operacional efetua uma movimentação baseada no quick migration onde as maquinas são pausadas temporariamente até efetuar a migração para o outro nó.


    João Carlos Xavier de Macedo Specialist Platforms Microsoft MCP,MCT,MCSA,MCTS,MCITP, ENTERPRISE VIRTUALIZATION WINDOWS SERVER 2008 R2,MCSE WINDOWS SERVER 2012

    • Marcado como Resposta Astequio terça-feira, 24 de março de 2015 13:10
    terça-feira, 24 de março de 2015 12:48
  • O Correto é: Efetua uma pausa nas VM's e move-as para o outro nó em questão. Pois não é possível efetuar LM de varias maquinas ao mesmo tempo.


    João Carlos Xavier de Macedo Specialist Platforms Microsoft MCP,MCT,MCSA,MCTS,MCITP, ENTERPRISE VIRTUALIZATION WINDOWS SERVER 2008 R2,MCSE WINDOWS SERVER 2012

    • Marcado como Resposta Astequio terça-feira, 24 de março de 2015 13:42
    terça-feira, 24 de março de 2015 13:35

Todas as Respostas

  • Boa tarde Astequio tudo bom ?

    Confere as configurações do seu LM.

    http://www.altaro.com/hyper-v/live-migration-in-hyper-v-explained-part-2/

    http://www.altaro.com/hyper-v/live-migration-in-hyper-v-explained-part-3/

    Acredito que seja alguma configuração que esteja faltando ou pendente.


    João Carlos Xavier de Macedo Specialist Platforms Microsoft MCP,MCT,MCSA,MCTS,MCITP, ENTERPRISE VIRTUALIZATION WINDOWS SERVER 2008 R2,MCSE WINDOWS SERVER 2012

    quinta-feira, 19 de março de 2015 20:00
  • Bom dia!
    Então, conforme os procedimentos:
    http://www.altaro.com/hyper-v/live-migration-in-hyper-v-explained-part-2/
    http://www.altaro.com/hyper-v/live-migration-in-hyper-v-explained-part-3/

    Está tudo Ok com as minhas configurações.

    Fiz até um teste pausando um dos “nodes”, as VMs foram movidas para “node” disponível normalmente, sem reiniciar, mas quando Eu desligo um dos “node” (HOSTs fisicos) ou puxo o cabo de rede de um dos HOTs, as VMs são movidas, mas as VMs são desligadas e quando elas aparecem no outro HOST, eles estão em estado de inicialização e depois que as VMs terminam suas inicializações o sistema operacional delas (VMs) retornam “Shutdown Event Tracker”.

    Observação: Os Cluster foi montado em cima de um iSCSI Target Server



    • Editado Astequio sexta-feira, 20 de março de 2015 16:21
    sexta-feira, 20 de março de 2015 16:19
  • http://blogs.msdn.com/b/virtual_pc_guy/archive/2014/01/10/virtual-machine-stop-action-in-a-cluster.aspx

    https://social.technet.microsoft.com/Forums/windowsserver/en-US/00fd73b0-a62d-4b97-a59e-e672498b1865/is-fault-tolerance-possible-with-hyperv-server-2012



    Se quiser derrubar uma árvore na metade do tempo, passe o dobro do tempo amolando o machado.

    • Marcado como Resposta Astequio terça-feira, 24 de março de 2015 13:10
    domingo, 22 de março de 2015 20:39
  • Olá Astequio,

    Pelo que entendi:

    Puxar o cabo de rede de um dos hosts ou até mesmo puxar o cabo de energia (Não Recomendado), não é uma forma planejada de failover para o sistema. Resumindo, o sistema não consegue descobrir quando a sua energia irá acabar ou no caso, quando você irá puxar o cabo de rede. Fazendo com que as máquinas virtuais desliguem repentinamente e religuem no outro servidor. O que a o sistema de failover clustering consegue saber é que um dos nós perdeu o contato.

    No caso do Live Migration ou até mesmo do Pause, considera-se um "failover planejado" pois vocês está informando o sistema que irá fazer isso, fazendo com que ele mova as máquinas antes mesmo do host se desligar.

    Espero ter ajudado!


    João Henrique Mortati Fuzinelli MCSA, MCP, MCTS

    • Marcado como Resposta Astequio terça-feira, 24 de março de 2015 13:10
    segunda-feira, 23 de março de 2015 16:50
  • Legal, entendi!

    Mas digamos que a placa de rede de uns dos meus servidores no “nodes” danificou, parou de funcionar, ou até mesmo um desligamento inesperado de um dos servidores no “nodes”.

    Como Eu posso aplicar a Alta disponibilidade para as minhas VMs? Pensando nesse cenário.

    terça-feira, 24 de março de 2015 12:39
  • Bom dia. Conforme as dicas do Felipe a Alta disponibilidade é exatamente pra suprir no caso de queda de um dos nós. Tenho ambientes configurados em cluster onde é efetuado a movimentação das VM's onde o Sistema operacional efetua uma movimentação baseada no quick migration onde as maquinas são pausadas temporariamente até efetuar a migração para o outro nó.


    João Carlos Xavier de Macedo Specialist Platforms Microsoft MCP,MCT,MCSA,MCTS,MCITP, ENTERPRISE VIRTUALIZATION WINDOWS SERVER 2008 R2,MCSE WINDOWS SERVER 2012

    • Marcado como Resposta Astequio terça-feira, 24 de março de 2015 13:10
    terça-feira, 24 de março de 2015 12:48
  • Então que dizer que… Caso um dos servidores do nó queima a sua placa de rede, ocorra um desligamento inesperado, queimou a sua fonte de energia, as VMs serão desligadas e serão transferidas para outro servidor disponível do nó. Digamos que isso é normal ??????

    Eu imaginava que a Alta disponibilidade fosse para proteger desses tipos de falhas também, até protege, mas o fato das VMs desligarem e ligarem novamente no outro servidor disponível, isso poderia danificar o sistema operacional instalado nas VMs.


    • Editado Astequio terça-feira, 24 de março de 2015 13:25
    terça-feira, 24 de março de 2015 13:24
  • O Correto é: Efetua uma pausa nas VM's e move-as para o outro nó em questão. Pois não é possível efetuar LM de varias maquinas ao mesmo tempo.


    João Carlos Xavier de Macedo Specialist Platforms Microsoft MCP,MCT,MCSA,MCTS,MCITP, ENTERPRISE VIRTUALIZATION WINDOWS SERVER 2008 R2,MCSE WINDOWS SERVER 2012

    • Marcado como Resposta Astequio terça-feira, 24 de março de 2015 13:42
    terça-feira, 24 de março de 2015 13:35