none
Exchange 2010 DAG Split-Brain questions théoriques RRS feed

  • Question

  • Sitôt après les fêtes déjà dans le boulot.

    Juste quelques questions pour bien valider ma compréhension du DAG et d'essayer d'arriver à une bascule entre deux sites automatique.

    - Lorsque l'on a un site AD avec un nombre PAIR ou IMPAIR de serveurs MBX dans un DAG répartit sur deux salles réseaux (dans un même bâtiment) avec le DAC d'activé.
    Que ce soit pair ou impair, aucune solution n'existe pour une reprise en cas de chute d'une salle sans intervention humaine.
    Soit la salle restante qui n'est pas tombée possède le majorité (nombre impair) ou le FSW (dans le cas d'un nombre pair) et dans ce cas tout va bien.
    Soit elle ne possède ni la majorité, ni le FSW et dans ce cas il faut faire une opération manuelle sur le DAG.
    Est-ce bien le fonctionnement et si oui connaissez vous les opérations à faire pour relancer le DAG lorsqu'il n'y a plus la majorité (Restore-DAGAvailability..., ou ajouter un Alternate FSW) ?
    Et dans ce cas que ce passe-t-il si la salle revient au bout d'une ou 2 heures est-ce que cela ne va pas poser problème ?

    - Lorsque l'on a deux sites AD est-ce que l'on peut arriver à mettre par exemple 1 CAS/HUB + 1 MBX de chaque côté avec les MBX dans le même DAG ?
    Peut-on arriver à une bascule automatique sans split-brain lorsque qu'une salle qui possède la majorité ou le FSW tombe en panne ?


    Merci d'avance, en espérant avoir été clair.
    samedi 29 décembre 2012 16:24

Réponses

  • Bonsoir,

    Tout d'abord, 2 salles dans un même bâtiment! Dans ce cas, on ne devrait pas utiliser le mode DAC.

    => Tout est automatique tant qu'il y a une majorité quelque part. L'intervention humaine n'est nécessaire que s'il n'y a pas de majorité et qu'il faut forcer un démarrage.

    Lorsqu'il n'y a plus de majorité, il existe de nombreuses opérations possibles: forcer le démarrage du service cluster sans quorum, ajouter/supprimer de nœuds/restore-availability..

    Si la salle revient, l'annuaire (avec ou sans réplication AD) indique qu'une reprise a été effectuée sur d'autres serveurs, éventuellement sur un autre site. Au mieux, la salle sera donc qu'en mode passif.

    Si l'on a 2 sites en mode DAC, il y a toutes les commandes nécessaires pour rebasculer sur le site principal.

    A bientôt,


    Thierry DEMAN. Exchange MVP. MCSA Windows Server 2012 (73 MCPs). https://mvp.support.microsoft.com/profile=CE2B565B-B13D-4C24-B04D-F0D5766D14A1 http://www.faqexchange.info

    • Marqué comme réponse ANexus115 lundi 31 décembre 2012 12:21
    dimanche 30 décembre 2012 20:51
    Modérateur
  • Si les salles sont indépendantes, effectivement il est plus prudent de passer en mode DAC ne serait ce que pour laisser le temps au réseau de se rétablir avant que les serveurs n'essaient de monter leurs bases.

    Lorsque l'on a deux sites AD est-ce que l'on peut arriver à mettre par exemple 1 CAS/HUB + 1 MBX de chaque côté avec les MBX dans le même DAG

    Le problème dans ce cas c'est que vous aurez un seul CAS (et CASArray) par site, il n'est pas possible de l'étendre sur plusieurs sites AD, vous risquez de perdre la redondance fournie par les CAS.

    Soit elle ne possède ni la majorité, ni le FSW et dans ce cas il faut faire une opération manuelle sur le DAG.

    Oui dans ce cas il faut faire un datacenter switchover, cette opération n'est pas automatiques.

    • Marqué comme réponse ANexus115 lundi 31 décembre 2012 12:21
    lundi 31 décembre 2012 08:36
    Modérateur
  • Hello,

    Je viens de faire un test ce matin.

    La bascule manuelle est bien passée.
    J'ai coupé la carte réseau sur les 2 MBX.
    J'ai relancé le cluster à la main (Restore) en stoppant avant les deux MBX du DAG.
    J'ai du taper cette commande pour que le DAG restore bien (pourtant les AD n'étaient pas tombés) :
    Set-ADServerSettings -PreferredServer AD_DANS_L_AUTRE_SITE
    Et c'est démarré.

    Et pour remettre les 2 MBX je les ai redémarrés (j'ai remarqué qu'il fallait mieux les redémarrer) et depuis le MBX actif j'ai fait un start des 2 autres MBX
    Le temps de resynchroniser et ils étaient "Sain/Healthy" dans le Status.

    Merci encore pour votre aide.
    • Modifié ANexus115 lundi 31 décembre 2012 12:20
    • Marqué comme réponse Florin Ciuca lundi 7 janvier 2013 15:04
    lundi 31 décembre 2012 12:20

Toutes les réponses

  • Bonsoir,

    Tout d'abord, 2 salles dans un même bâtiment! Dans ce cas, on ne devrait pas utiliser le mode DAC.

    => Tout est automatique tant qu'il y a une majorité quelque part. L'intervention humaine n'est nécessaire que s'il n'y a pas de majorité et qu'il faut forcer un démarrage.

    Lorsqu'il n'y a plus de majorité, il existe de nombreuses opérations possibles: forcer le démarrage du service cluster sans quorum, ajouter/supprimer de nœuds/restore-availability..

    Si la salle revient, l'annuaire (avec ou sans réplication AD) indique qu'une reprise a été effectuée sur d'autres serveurs, éventuellement sur un autre site. Au mieux, la salle sera donc qu'en mode passif.

    Si l'on a 2 sites en mode DAC, il y a toutes les commandes nécessaires pour rebasculer sur le site principal.

    A bientôt,


    Thierry DEMAN. Exchange MVP. MCSA Windows Server 2012 (73 MCPs). https://mvp.support.microsoft.com/profile=CE2B565B-B13D-4C24-B04D-F0D5766D14A1 http://www.faqexchange.info

    • Marqué comme réponse ANexus115 lundi 31 décembre 2012 12:21
    dimanche 30 décembre 2012 20:51
    Modérateur
  • Merci pour ta réponse. En fait il s'agit vraiment de deux salles sépares qui ont un risque de coupure du lien (donc j'ai active le DAG). En mode DAC en cas de coupure d'un site et donc perte de la majorité je lance la commande Stop-DAG sur les serveurs perdus, puis Start-DAG sur un serveur restant. Ensuite lorsque le site remonte je lance un Start pour remettre les serveurs dans le DAG. Est-ce que je me trompes pas ? Merci bien.
    dimanche 30 décembre 2012 22:16
  • Si les salles sont indépendantes, effectivement il est plus prudent de passer en mode DAC ne serait ce que pour laisser le temps au réseau de se rétablir avant que les serveurs n'essaient de monter leurs bases.

    Lorsque l'on a deux sites AD est-ce que l'on peut arriver à mettre par exemple 1 CAS/HUB + 1 MBX de chaque côté avec les MBX dans le même DAG

    Le problème dans ce cas c'est que vous aurez un seul CAS (et CASArray) par site, il n'est pas possible de l'étendre sur plusieurs sites AD, vous risquez de perdre la redondance fournie par les CAS.

    Soit elle ne possède ni la majorité, ni le FSW et dans ce cas il faut faire une opération manuelle sur le DAG.

    Oui dans ce cas il faut faire un datacenter switchover, cette opération n'est pas automatiques.

    • Marqué comme réponse ANexus115 lundi 31 décembre 2012 12:21
    lundi 31 décembre 2012 08:36
    Modérateur
  • Hello,

    Je viens de faire un test ce matin.

    La bascule manuelle est bien passée.
    J'ai coupé la carte réseau sur les 2 MBX.
    J'ai relancé le cluster à la main (Restore) en stoppant avant les deux MBX du DAG.
    J'ai du taper cette commande pour que le DAG restore bien (pourtant les AD n'étaient pas tombés) :
    Set-ADServerSettings -PreferredServer AD_DANS_L_AUTRE_SITE
    Et c'est démarré.

    Et pour remettre les 2 MBX je les ai redémarrés (j'ai remarqué qu'il fallait mieux les redémarrer) et depuis le MBX actif j'ai fait un start des 2 autres MBX
    Le temps de resynchroniser et ils étaient "Sain/Healthy" dans le Status.

    Merci encore pour votre aide.
    • Modifié ANexus115 lundi 31 décembre 2012 12:20
    • Marqué comme réponse Florin Ciuca lundi 7 janvier 2013 15:04
    lundi 31 décembre 2012 12:20