none
DAG distribuito su due DataCenter RRS feed

  • Discussione generale

  • Salve,

    Seguendo gli articoli di Henrik Walther disponibili su Msexchange.org, ho implementato una infrastruttura Exchange 2010 distribuita su 2 DataCenter distinti e composta di 4 Exchange Server. Lo scopo è di implementare una soluzione Active/Active.

    Ciascun sito contiene 1 DC, 1 HUB & CAS, 1 Mailbox, è configurato a livello di AD come site distinto con subnet differenti ed è raggiungibile con un URL distinto (es: mail1.dominio.it e mail2.dominio.it).

    I due Mailbox Server che compongono il DAG contengono ciascuno un singolo DBase attivo e la copia passiva dell’altro Mailbox.

    Il Server di Witness primario e un DC situato nel sito primario, mentre il Witness alternativo e un DC situato nel sito secondario.

    Tutto funziona regolarmente; i client lavorano regolarmente sul sito primario, ed i test eseguiti con alcune mailbox create sul sito secondario confermano che tutti i servizi sono OK anche nel secondo sito.

    Problema: in modo casuale il Mailbox Server situato nel sito secondario riporta un errore circa la perdita di contatto con il quorum, e viene attivata la copia del DB situata nel sito primario. I Server sono monitorati tramite SCOM che riporta diversi errori:

    -          The Cluster service is shutting down because quorum was lost

    -          Cluster resource 'IPv4 Static Address 1 (Cluster Group)' in clustered service or application 'Cluster Group' failed

    Quando riceviamo l’errore è sufficiente tramite la EMC usare la funzione “Move Active Mailbox database” per riportare tutto alla normalità.

    Qualche idea o suggerimento?

    Grazie!

    martedì 11 novembre 2014 08:25

Tutte le risposte

  • Quando si progetta un'architettura distribuita su più site è importante avere chiaro l'obiettivo e quali sono in meccanismi di Exchange che entrano in gioco.

    Ad esempio, la prima cosa da chiarire è che il DAG non è altro che un Failover Cluster e come tale ha bisogno di avere un "quorum" per poter funzionare.

    Nel tuo caso il DAG è composto da 4 server, 2 in un sito e 2 nell'altro. In questo caso, avendo un numero pari di oggetti entra in gioco il witness, che tu hai posizionato nel sito primario.

    Quindi, in caso di interruzione della connettività tra i due siti il quorum sarà sempre costituito dai mailbox server del sito primario, avendo il quorum in locale.

    Tieni presente che l'Alternate Witness entra in gioco solo in scenari particolari di Datacenter Activation Coordination, quindi nel tuo caso non viene considerato, anche perchè altrimenti avresti un numero pari di oggetti e non sarebbe possibile stabilire il quorum

    http://technet.microsoft.com/en-us/library/dd298065(v=exchg.150).aspx

    Io verificherei se ci sono problemi di connettività o di latenza tra i due site, se è così il comportamento è quello atteso.

    Tieni conto che ci sono dei requisiti minimi di latenza supportati tra i membri di un DAG.

    Leggi la sezione "network requirements" di questo documento:

    http://technet.microsoft.com/en-us/library/dd638104(v=exchg.150).aspx

    Roberto


    IT Consultant | Microsoft MCTS MCITP MCSA MCSE MCT

    martedì 11 novembre 2014 13:21
    Moderatore
  • Grazie Roberto per la pronta risposta.

    I concetti di Cluster mi sono relativamente noti avendo realizzato già alcune soluzioni di alta affidabilità in ambiente Hyper-V. Al contrario di un di cluster a due nodi fisici con uno Storage in modalità "Node and Disk Majority” dove ho un nodo che gestisce il quorum e le aree di storage, nel Cluster di un DAG Exchange 2010 il quorum è rappresentato dal Server Witness? Come riesco a capire quale nodo gestisce il quorum? È solo per il fatto che il Server Witness è nello stesso site che il relativo Server MBX è il "nodo primario"?

    Se i problemi di latenza fossero dovuti a brevi congestioni sulla connettività, pertanto non prevedibili, disponendo di soltanto 2 Mailbox Server ciascuno in un site (gli altri Server sono HUB & CAS) posso creare un 2° DAG mettendo come Witness il DC che si trova sul sito secondario e la copia primaria sul Mailbox Server dello stesso site?

    Grazie!

    martedì 11 novembre 2014 14:48
  • Urge un chiarimento sul concetto di quorum :-)

    il quorum non è un oggetto, ma come definizione è: la maggioranza degli oggetti necessari a sostenere il cluster

    Nel tuo caso abbiamo 5 oggetti in gioco, 4 server e 1 File Share Witness, quindi la maggioranza (quorum) è raggiunta quando rimangono attivi almeno 3 oggetti nelle seguenti combinazioni:

    1) 3 server

    2) 2 server + 1 witness

    Quindi, se la connessione tra il sito primario non funziona o funziona male, il quorum (la maggioranza) può essere raggiunta solo nel sito primario, avendo 2 server e 1 witness, quindi 3 oggetti. Il sito secondario rimarrebbe con 2 oggetti isolati, che andrebbero offline.

    Se vuoi fare in modo che in caso di problemi di connettività, ogni sito abbia in locale i suoi database, la soluzione che hai adottato non è quella corretta.

    La soluzione potrebbe essere quella di fare due DAG differenti:

    DAG1 con i DB degli utenti del sito primario: 1 mailbox sul sito primario, 1 mailbox sul sito secondario, 1 witness locale al sito primario

    DAG2 con i DB degli utenti del sito secondario: 1 mailbox sul sito primario, 1 mailbox sul sito secondario, 1 witness locale al sito secondario

    In questo modo, se la connettività viene a mancare, ogni sito avrà il quorum degli oggetti necessari a sostenere il cluster con i DB locali.

    Roberto


    IT Consultant | Microsoft MCTS MCITP MCSA MCSE MCT

    martedì 11 novembre 2014 15:22
    Moderatore
  • Grazie Roberto.

    Mi stai confermando quella che era una mia ipotesi.

    Domanda: Un Mailbox Server membro di DAG1 può diventare membro di un secondo DAG2?

    In pratica:

    -           - DAG1: Membri EX1 + EX2 --- DB con copia primaria attiva su EX1 (sito primario)

    -           - DAG2: Membri EX1 + EX2 --- DB con copia primaria attiva su EX2 (sito secondario)

    Grazie!

    martedì 11 novembre 2014 15:30
  • Ti giro la domanda:

    un nodo membro di un failover cluster CLUSTER1 può essere contemporaneamente membro di un altro failover cluster CLUSTER2?

    So che hai risposto correttamente :-)

    No, non è possibile.

    Roberto


    IT Consultant | Microsoft MCTS MCITP MCSA MCSE MCT

    martedì 11 novembre 2014 15:49
    Moderatore
  • Temevo la tua risposta....

    Altre 2 domande veloci, le ultime spero:

    1. Un Mailbox Server che fa parte di un DAG può anche avere il ruolo HUB & CAS? L’unico vincolo è che non può fare parte di un NLB Windows quale modo per mettere in alta affidabilità la parte di Front End?
    2. È corretto che nella configurazione DAG la replica sia disattiva sulla MAPI Network?

    Mille Grazie!

    martedì 11 novembre 2014 18:06
  • I ruoli Mailbox, H&T e CAS di Exchange 2010 possono essere collocati su un unico server, anche se il server in questione fa parte di un DAG.

    Nel caso di server all-in-one (tutti i ruoli su un server) non è supportato l'uso di NLB come meccanismo di load balancing per la parte CAS.

    Nel caso di server all-in-one è supportato invece l'utilizzo di load balancer esterni, di qualunque genere basta che sia certificato, ad esempio F5, Kemp, Netscaler, ecc...

    E' corretto che il DAG non replichi attraverso MAPI network se hai una network alternativa da dedicare alla replica. Se hai una sola network puoi abilitare la replica sulla MAPI network.

    Roberto


    IT Consultant | Microsoft MCTS MCITP MCSA MCSE MCT

    martedì 11 novembre 2014 23:03
    Moderatore
  • Conosci qualche documentazione che spiega bene aspetti tecnici di funzionamento del DAG e più in generale di Exchange 2010 come ad esempio la latenza di 500 ms riportata nell'articolo?

      - http://technet.microsoft.com/it-it/library/dd638104(v=exchg.150).aspx

    Mi riferisco in particolare a specifiche quali al "capacity planning" della banda da assegnare in base al numero di device (Outlook, smartphone), larghezza di banda utilizzata per le loro operazioni di sincronizzazione, uso della banda durante operazioni quali "move mailbox".

    In particolare in quest'ultimo scenario di "move mailbox" stò pensando ad un caso del tipo:

      - su DAG1 composto da EX1 ed EX2 rispettivamente distribuiti su due site, decido di migrare alcune mailbox su DAG2 composto dalla coppia di Serve EX3 ed EX4 distribuiti su entrambi i site, tale operazione comporta di nuovo il passaggio di tutti i contenuti delle mailbox migrate sulla WAN?

    Cosa ne pensi?

    L'unica cosa che ho trovato è il "Exchange 2010 Server Role Requirements Calculator" ma è già difficile capire come tirare fuori qualche numero sensato.

    2000 Grazie!

    mercoledì 12 novembre 2014 07:02
  • Purtroppo non c'è documentazione su quell'argomento specifico.

    Per quanto riguarda l'esempio che hai fatto, se fai il move di una mailbox da un DB attivo sul sito primario verso un DB che è attivo sul sito secondario, certo, i dati transito sulla wan.

    Tieni conto che se anche la copia fosse locale, immaginando di attivare le copie dei DB del DAGe e del DAG2 sullo stesso sito, in questo caso la copia avverrebbe localmente, ma ci sarebbe poi il traffico relativo alla replica verso l'altro sito.

    Roberto


    IT Consultant | Microsoft MCTS MCITP MCSA MCSE MCT

    mercoledì 12 novembre 2014 21:20
    Moderatore