none
DAG - Site unico RRS feed

  • Pergunta

  • Pessoal,

    Estou com o seguinte senário, 4 servidores com Exchange 2010 SP1 STD, sendo dois para CAS/hub em NLB e 2 para MBX.

    Configurei o DAG, e o move de bases está funcionando, mas quando paro o servidor que utilizei com Witness e também o um dos Servidores MBX o s dois servidores restantes não mantem o ambiente.

    Já olhei a documentação e vários artigos, fala do DAC que resolveria mas em sites Separados, no meu caso o site é unico. O que se pode fazer para contornar este problema?

    Obrigado desde já.


    Alessandro Rodrigo de Proença
    sexta-feira, 25 de março de 2011 01:16

Respostas

  • Alessandro,

    O que acontece é que o Cluster do Windows Server 2008 mudou bastante em relação ao que funcionava no Windows 2003. No seu caso você tem 3 votos, que é o sistema atual. 1 Voto de CADA MBX e 1 voto do File Share Witness (que é o Quorum mode usado pelo Exchange)

    Para um cluster funcionar precisa de mais de 50% de votos. no seu caso precisa de 2 de 3 componentes funcionando. Por exemplo. Se o Witnesse file Share parar de funcionar não tem impacto nenhum em nenhuma funcionalidade, inclusive no failover, outra caso seria, se um dos servidores somente parar, também não acontece nada. Mas se um servidor mais o File share parar, o cluster não funcionará mesmo.

    Como dito pelos colegas e confirmado por você, o share não deve ficar em um Mailbox.

    Ou seja, esse comportamento que você descrever é o funcionamento normal do Failover Cluster.

    Quanto a multiplos sites, o tipo de quorum usado é File Share, independente de ser cluster de Exchange, é design de Failover Cluster.

    Abaixo um link com algumas informações adicionais.

    http://www.opsvault.com/windows-server-failover-clustering-quorum-configuration-models-explained/

    sexta-feira, 25 de março de 2011 23:27
  • Olá Alessandro, blza?

    Este é um grande problema. Se o Quorum não está disponivel o Windows Cluster não consegue determinar qual nó do cluster está ativo durante uma falha (para o processo de Failover). Quando você desliga do Quorum (FSW) nada acontece, pois a "votação" é de um fator secundário para determinar se um nó está ou não disponivel, o fator primário é o Heart Beat. Quando vc desliga um dos nós do cluster (Mailbox Server), ele pára de responder na rede Heat Beat, o Windows Cluster então vai no Quorum para determinar se o Nó está realmente indisponivel, como ele não consegue acessar o Quorum o Windows Cluster não inicia o processo de Failover. Vc deve fazer isso manualmente, ou seja, abrir o cluster admin (ou na propria console do Exchange) e mover os recursos de database para o outro nó.

    Infelizmente isto é da arquitetura do produto. Note que o unico problema é que o processo de failover não ocorre automaticamente.

    Sei que é um processo complexo, mas bem superficilamente é isso que acontece.

    Abs


    Thiago A. E. Carmo
    MCSE, MCSA + M, MCITP: EMA 2007/2010, MCITP: SA 2008, MCTS, MCT, MCP
    sexta-feira, 25 de março de 2011 20:06

Todas as Respostas

  • Alessandro,

    Dá uma olhada nessa thread http://social.technet.microsoft.com/Forums/pt-BR/exc2007pt/thread/44b8bd19-f86a-4d45-9bc2-675948a298dc  e configura o Cas Array e RPC Client Access Server.

    Abs e caso útil classifique.


    David Chaves
    sexta-feira, 25 de março de 2011 02:58
    Moderador
  • Ola David,

    Já está configurado, mas a questão não é o Casarray e sim o disco Quorum, o Cassarray só disponibiliza a alta dispobilidade para o outlook, owa, mas não pra o disco de quorum infelizmente.

    Obrigado.


    Alessandro Rodrigo de Proença
    sexta-feira, 25 de março de 2011 13:48
  • Isso é Alessandro,

    Procure colocar o Quorum em qualquer outro servidor que não seja um dos seus servidores do Cluster, pode ser um file Server.


    Jonathan Santos | http://jonathanrsantos.wordpress.com MCP | MCSA | MCSA Messaging | MCSE Messaging
    sexta-feira, 25 de março de 2011 14:43
    Moderador
  • Alessandro,

    Que ótimo então, mais apenas detalhando mais, segue algumas informações para lhe ajudar no seu entendimento.

    Basicamente vc deve executar o comando para criar o Array: New-ClientAccessArray –Name “CAS Array01” –Fqdn “outlook.domian.local” –Site “BeloHorizonte”. Assim todos os CAS instalados no site "BeloHorizonte" faram parte deste array. (Dessa maneira você cria a matriz de CAS que vai se unir com o NLB) e já o comando: Set-MailboxDatabase DB1 -RpcClientAccessServer “outlook.domain.local” cria um nome único para acesso dos seus clientes MAPI.

    Sobre o Share Witness, isso não é uma atividade normal o seu DAG parar por falha dele ou reinicialização da máquina com dele, vou checar mais informações para lhe passar.

    O share witness se encontra configurado em qual equipamento? Qual a função desse equipamento? Caso seja um dc, quantos dcs vc tem na rede? Tenha certeza do que eu pedi a você já tenha sido realizado.

    Aguardo as respostas,


    David Chaves
    sexta-feira, 25 de março de 2011 14:55
    Moderador
  • Alessandro,

    Dê uma olhada neste thread também http://social.technet.microsoft.com/Forums/en-US/exchange2010/thread/d1dffeef-172d-4501-8445-471540aae0c5 , ele é muito bom e confirma o que lhe informe que não existe falha caso o seu share witness venha fica off-line, apenas você perde no caso do desligameno do nó primário a inicialização do outro nó e após a reincialização do nó primário o mesmo não sobe por não encontrar o compartilhamento.


    David Chaves
    sexta-feira, 25 de março de 2011 15:03
    Moderador
  • opa,

    Já está assim, e mesmo assim não funciona.

     

    obrigado.


    Alessandro Rodrigo de Proença
    sexta-feira, 25 de março de 2011 15:32
  • Alessandro,

    Responda as perguntas que eu fiz para podermos dar continuidade a o thread.

    Abs,


    David Chaves
    sexta-feira, 25 de março de 2011 15:50
    Moderador
  • Ola David,

    O cass array já tá estava configurado e está ok.

    *O share witness se encontra configurado em qual equipamento? Qual a função desse equipamento?

    Nos Servidores HUB/CAS da solução

    *Caso seja um dc, quantos dcs vc tem na rede?

    2 servidores no mesmo site.

    Obrigago pela ajuda até o momento.


    Alessandro Rodrigo de Proença
    sexta-feira, 25 de março de 2011 17:30
  • Alessandro,

    Vamos fazer um teste, você tem 2 servidores com função de CAS/HUB e um deles está o share witness. Quando você reinicia o servidor que tem o Share Witness o DAG fica down como você falou, sendo assim tente reiniciar o servidor CAS/HUB que não tem o Share Witness para ver se o DAG também vai ficar down. Caso fique, ae poderemos ter a certeza que o problema não está no Share Witness e sim nas configurações da Matriz do CAS.

    Vamos lá que conseguimos.

    Abs,


    David Chaves
    sexta-feira, 25 de março de 2011 18:09
    Moderador
  • David,

    Se eu reincio o DAG witness não para nada, depois que ele sobre reinicio o outro e não para nada também, o acontece é quando para o o DAG witness e qualquer servidor de BASE.

    E quando ficam dois servidores CAS\HUB e outro BASE, só ira retornar o serviço quando o outro CAS voltar.

    Ao que parece ele só funciona com tres servidores.

     


    Alessandro Rodrigo de Proença
    sexta-feira, 25 de março de 2011 18:50
  • Alessandro,

    A sua resposta está confusa, defina melhor por favor. E o que você quer dizer com DAG Witness?

    Abs,


    David Chaves
    sexta-feira, 25 de março de 2011 19:34
    Moderador
  • Olá Alessandro, blza?

    Este é um grande problema. Se o Quorum não está disponivel o Windows Cluster não consegue determinar qual nó do cluster está ativo durante uma falha (para o processo de Failover). Quando você desliga do Quorum (FSW) nada acontece, pois a "votação" é de um fator secundário para determinar se um nó está ou não disponivel, o fator primário é o Heart Beat. Quando vc desliga um dos nós do cluster (Mailbox Server), ele pára de responder na rede Heat Beat, o Windows Cluster então vai no Quorum para determinar se o Nó está realmente indisponivel, como ele não consegue acessar o Quorum o Windows Cluster não inicia o processo de Failover. Vc deve fazer isso manualmente, ou seja, abrir o cluster admin (ou na propria console do Exchange) e mover os recursos de database para o outro nó.

    Infelizmente isto é da arquitetura do produto. Note que o unico problema é que o processo de failover não ocorre automaticamente.

    Sei que é um processo complexo, mas bem superficilamente é isso que acontece.

    Abs


    Thiago A. E. Carmo
    MCSE, MCSA + M, MCITP: EMA 2007/2010, MCITP: SA 2008, MCTS, MCT, MCP
    sexta-feira, 25 de março de 2011 20:06
  • Alessandro,

    Agora como confirmado pelo Thiago, mesmo que o quorum não esteja ligado o único processo que é prejudicado é o failover automático, sendo assim o DAG não para de funcionar. Matamos está questão então, correto? Agora que temos a certeza que o problema não está ligado a falha do Share Witness.... Defina melhor o seu post anterior para podermos continuar com o problema... faça os testes que eu solicitei.

    Abs, 


    David Chaves
    sexta-feira, 25 de março de 2011 20:54
    Moderador
  • Alessandro,

    O que acontece é que o Cluster do Windows Server 2008 mudou bastante em relação ao que funcionava no Windows 2003. No seu caso você tem 3 votos, que é o sistema atual. 1 Voto de CADA MBX e 1 voto do File Share Witness (que é o Quorum mode usado pelo Exchange)

    Para um cluster funcionar precisa de mais de 50% de votos. no seu caso precisa de 2 de 3 componentes funcionando. Por exemplo. Se o Witnesse file Share parar de funcionar não tem impacto nenhum em nenhuma funcionalidade, inclusive no failover, outra caso seria, se um dos servidores somente parar, também não acontece nada. Mas se um servidor mais o File share parar, o cluster não funcionará mesmo.

    Como dito pelos colegas e confirmado por você, o share não deve ficar em um Mailbox.

    Ou seja, esse comportamento que você descrever é o funcionamento normal do Failover Cluster.

    Quanto a multiplos sites, o tipo de quorum usado é File Share, independente de ser cluster de Exchange, é design de Failover Cluster.

    Abaixo um link com algumas informações adicionais.

    http://www.opsvault.com/windows-server-failover-clustering-quorum-configuration-models-explained/

    sexta-feira, 25 de março de 2011 23:27
  • Aloísio,

    Obrigado por ter acrescentado ao nosso thread com a sua opinião, Anderson tem alguma novidade?


    David Chaves
    sábado, 26 de março de 2011 00:31
    Moderador
  • olá Aloisio,

    Agora entendi como funciona, obrigado pela explicação. Mudei o Witness para servidores fora da solução exchange e não tive mais parada no serviço de cluster.

    Problema solucionado.


    Alessandro Rodrigo de Proença
    sábado, 26 de março de 2011 11:30
  • Caro Alessandro,

    Acabei lendo novamente o assunto da sua Thread e na realidade ocorreu uma falha mesmo, estava pensando que o problema era apenas quando você reiniciava o share Witness apenas e não quando reiniciava o Share Witness + um nó do DAG. Essa configuração só é possível caso você coloque o FSW fora sua solução do Exchange como você realizou.

    Parabéns e boa sorte, parabéns também a o Aloísio que identificou melhor a sua pergunta.

    sábado, 26 de março de 2011 12:24
    Moderador