Usuário com melhor resposta
DAG - Site unico

Pergunta
-
Pessoal,
Estou com o seguinte senário, 4 servidores com Exchange 2010 SP1 STD, sendo dois para CAS/hub em NLB e 2 para MBX.
Configurei o DAG, e o move de bases está funcionando, mas quando paro o servidor que utilizei com Witness e também o um dos Servidores MBX o s dois servidores restantes não mantem o ambiente.
Já olhei a documentação e vários artigos, fala do DAC que resolveria mas em sites Separados, no meu caso o site é unico. O que se pode fazer para contornar este problema?
Obrigado desde já.
Alessandro Rodrigo de Proença
Respostas
-
Alessandro,
O que acontece é que o Cluster do Windows Server 2008 mudou bastante em relação ao que funcionava no Windows 2003. No seu caso você tem 3 votos, que é o sistema atual. 1 Voto de CADA MBX e 1 voto do File Share Witness (que é o Quorum mode usado pelo Exchange)
Para um cluster funcionar precisa de mais de 50% de votos. no seu caso precisa de 2 de 3 componentes funcionando. Por exemplo. Se o Witnesse file Share parar de funcionar não tem impacto nenhum em nenhuma funcionalidade, inclusive no failover, outra caso seria, se um dos servidores somente parar, também não acontece nada. Mas se um servidor mais o File share parar, o cluster não funcionará mesmo.
Como dito pelos colegas e confirmado por você, o share não deve ficar em um Mailbox.
Ou seja, esse comportamento que você descrever é o funcionamento normal do Failover Cluster.
Quanto a multiplos sites, o tipo de quorum usado é File Share, independente de ser cluster de Exchange, é design de Failover Cluster.
Abaixo um link com algumas informações adicionais.
http://www.opsvault.com/windows-server-failover-clustering-quorum-configuration-models-explained/
- Marcado como Resposta David ChavesModerator sábado, 26 de março de 2011 12:26
-
Olá Alessandro, blza?
Este é um grande problema. Se o Quorum não está disponivel o Windows Cluster não consegue determinar qual nó do cluster está ativo durante uma falha (para o processo de Failover). Quando você desliga do Quorum (FSW) nada acontece, pois a "votação" é de um fator secundário para determinar se um nó está ou não disponivel, o fator primário é o Heart Beat. Quando vc desliga um dos nós do cluster (Mailbox Server), ele pára de responder na rede Heat Beat, o Windows Cluster então vai no Quorum para determinar se o Nó está realmente indisponivel, como ele não consegue acessar o Quorum o Windows Cluster não inicia o processo de Failover. Vc deve fazer isso manualmente, ou seja, abrir o cluster admin (ou na propria console do Exchange) e mover os recursos de database para o outro nó.
Infelizmente isto é da arquitetura do produto. Note que o unico problema é que o processo de failover não ocorre automaticamente.
Sei que é um processo complexo, mas bem superficilamente é isso que acontece.
Abs
Thiago A. E. Carmo
MCSE, MCSA + M, MCITP: EMA 2007/2010, MCITP: SA 2008, MCTS, MCT, MCP- Marcado como Resposta David ChavesModerator sábado, 26 de março de 2011 12:24
Todas as Respostas
-
Alessandro,
Dá uma olhada nessa thread http://social.technet.microsoft.com/Forums/pt-BR/exc2007pt/thread/44b8bd19-f86a-4d45-9bc2-675948a298dc e configura o Cas Array e RPC Client Access Server.
Abs e caso útil classifique.
David Chaves -
-
Isso é Alessandro,
Procure colocar o Quorum em qualquer outro servidor que não seja um dos seus servidores do Cluster, pode ser um file Server.
Jonathan Santos | http://jonathanrsantos.wordpress.com MCP | MCSA | MCSA Messaging | MCSE Messaging -
Alessandro,
Que ótimo então, mais apenas detalhando mais, segue algumas informações para lhe ajudar no seu entendimento.
Basicamente vc deve executar o comando para criar o Array: New-ClientAccessArray –Name “CAS Array01” –Fqdn “outlook.domian.local” –Site “BeloHorizonte”. Assim todos os CAS instalados no site "BeloHorizonte" faram parte deste array. (Dessa maneira você cria a matriz de CAS que vai se unir com o NLB) e já o comando: Set-MailboxDatabase DB1 -RpcClientAccessServer “outlook.domain.local” cria um nome único para acesso dos seus clientes MAPI.
Sobre o Share Witness, isso não é uma atividade normal o seu DAG parar por falha dele ou reinicialização da máquina com dele, vou checar mais informações para lhe passar.
O share witness se encontra configurado em qual equipamento? Qual a função desse equipamento? Caso seja um dc, quantos dcs vc tem na rede? Tenha certeza do que eu pedi a você já tenha sido realizado.
Aguardo as respostas,
David Chaves -
Alessandro,
Dê uma olhada neste thread também http://social.technet.microsoft.com/Forums/en-US/exchange2010/thread/d1dffeef-172d-4501-8445-471540aae0c5 , ele é muito bom e confirma o que lhe informe que não existe falha caso o seu share witness venha fica off-line, apenas você perde no caso do desligameno do nó primário a inicialização do outro nó e após a reincialização do nó primário o mesmo não sobe por não encontrar o compartilhamento.
David Chaves -
-
-
Ola David,
O cass array já tá estava configurado e está ok.
*O share witness se encontra configurado em qual equipamento? Qual a função desse equipamento?
Nos Servidores HUB/CAS da solução
*Caso seja um dc, quantos dcs vc tem na rede?
2 servidores no mesmo site.
Obrigago pela ajuda até o momento.
Alessandro Rodrigo de Proença -
Alessandro,
Vamos fazer um teste, você tem 2 servidores com função de CAS/HUB e um deles está o share witness. Quando você reinicia o servidor que tem o Share Witness o DAG fica down como você falou, sendo assim tente reiniciar o servidor CAS/HUB que não tem o Share Witness para ver se o DAG também vai ficar down. Caso fique, ae poderemos ter a certeza que o problema não está no Share Witness e sim nas configurações da Matriz do CAS.
Vamos lá que conseguimos.
Abs,
David Chaves -
David,
Se eu reincio o DAG witness não para nada, depois que ele sobre reinicio o outro e não para nada também, o acontece é quando para o o DAG witness e qualquer servidor de BASE.
E quando ficam dois servidores CAS\HUB e outro BASE, só ira retornar o serviço quando o outro CAS voltar.
Ao que parece ele só funciona com tres servidores.
Alessandro Rodrigo de Proença -
-
Olá Alessandro, blza?
Este é um grande problema. Se o Quorum não está disponivel o Windows Cluster não consegue determinar qual nó do cluster está ativo durante uma falha (para o processo de Failover). Quando você desliga do Quorum (FSW) nada acontece, pois a "votação" é de um fator secundário para determinar se um nó está ou não disponivel, o fator primário é o Heart Beat. Quando vc desliga um dos nós do cluster (Mailbox Server), ele pára de responder na rede Heat Beat, o Windows Cluster então vai no Quorum para determinar se o Nó está realmente indisponivel, como ele não consegue acessar o Quorum o Windows Cluster não inicia o processo de Failover. Vc deve fazer isso manualmente, ou seja, abrir o cluster admin (ou na propria console do Exchange) e mover os recursos de database para o outro nó.
Infelizmente isto é da arquitetura do produto. Note que o unico problema é que o processo de failover não ocorre automaticamente.
Sei que é um processo complexo, mas bem superficilamente é isso que acontece.
Abs
Thiago A. E. Carmo
MCSE, MCSA + M, MCITP: EMA 2007/2010, MCITP: SA 2008, MCTS, MCT, MCP- Marcado como Resposta David ChavesModerator sábado, 26 de março de 2011 12:24
-
Alessandro,
Agora como confirmado pelo Thiago, mesmo que o quorum não esteja ligado o único processo que é prejudicado é o failover automático, sendo assim o DAG não para de funcionar. Matamos está questão então, correto? Agora que temos a certeza que o problema não está ligado a falha do Share Witness.... Defina melhor o seu post anterior para podermos continuar com o problema... faça os testes que eu solicitei.
Abs,
David Chaves- Editado David ChavesModerator sábado, 26 de março de 2011 00:34
-
Alessandro,
O que acontece é que o Cluster do Windows Server 2008 mudou bastante em relação ao que funcionava no Windows 2003. No seu caso você tem 3 votos, que é o sistema atual. 1 Voto de CADA MBX e 1 voto do File Share Witness (que é o Quorum mode usado pelo Exchange)
Para um cluster funcionar precisa de mais de 50% de votos. no seu caso precisa de 2 de 3 componentes funcionando. Por exemplo. Se o Witnesse file Share parar de funcionar não tem impacto nenhum em nenhuma funcionalidade, inclusive no failover, outra caso seria, se um dos servidores somente parar, também não acontece nada. Mas se um servidor mais o File share parar, o cluster não funcionará mesmo.
Como dito pelos colegas e confirmado por você, o share não deve ficar em um Mailbox.
Ou seja, esse comportamento que você descrever é o funcionamento normal do Failover Cluster.
Quanto a multiplos sites, o tipo de quorum usado é File Share, independente de ser cluster de Exchange, é design de Failover Cluster.
Abaixo um link com algumas informações adicionais.
http://www.opsvault.com/windows-server-failover-clustering-quorum-configuration-models-explained/
- Marcado como Resposta David ChavesModerator sábado, 26 de março de 2011 12:26
-
-
-
Caro Alessandro,
Acabei lendo novamente o assunto da sua Thread e na realidade ocorreu uma falha mesmo, estava pensando que o problema era apenas quando você reiniciava o share Witness apenas e não quando reiniciava o Share Witness + um nó do DAG. Essa configuração só é possível caso você coloque o FSW fora sua solução do Exchange como você realizou.
Parabéns e boa sorte, parabéns também a o Aloísio que identificou melhor a sua pergunta.
- Marcado como Resposta David ChavesModerator sábado, 26 de março de 2011 12:26
- Não Marcado como Resposta David ChavesModerator sábado, 26 de março de 2011 12:30