none
Problema con FailOver generado por Quorum con dos Nodos. RRS feed

  • Pregunta

  • Estimados,

    Entorno: Windows 2008 SP2 Enterprise

    Tengo un problema cuando se realiza un failover, informa esto.  Si hago pruebas reiniciando el activo, el nodo pasivo no logra hacer el failover correctamente y hasta que no inicia el server que era activo pierdo contacto con los recursos y con el host cluster en si.

    El Quorum esta en Node and Disk Majority

    Log Name:      System

    Source:        Microsoft-Windows-FailoverClustering

    Event ID:      1044

    Task Category: IP Address Resource

    Level:         Error

    Encountered a failure when attempting to create a new NetBIOS interface while bringing resource '' online (error code '1726'). The maximum number of NetBIOS names may have been exceeded.

     

    Log Name:      System

    Source:        Microsoft-Windows-FailoverClustering

    Event ID:      1177

    Task Category: None

    Level:         Critical

    Keywords:     

    User:          SYSTEM

    Computer:      N1.p44.loc

    Description:

    The Cluster service is shutting down because quorum was lost. This could be due to the loss of network connectivity between some or all nodes in the cluster, or a failover of the witness disk.

    Run the Validate a Configuration wizard to check your network configuration. If the condition persists, check for hardware or software errors related to the network adapter. Also check for failures in any other network components to which the node is connected such as hubs, switches, or bridges.

    Ejecute una validación y no informa falla o mala configuración;

    Testing has completed successfully. The configuration appears to be suitable for clustering, but you should review the report, which contains warnings that you might need to respond to. For details, click "View Report."

    No detecto falla alguna.

    Que puede ser??

    gracias.

    Ale.


    Alejandro | Especialista en Infraestructura Microsoft |
    miércoles, 25 de mayo de 2011 21:44

Respuestas

  • hola Marc,

    Lo resolvio destildando el uso de netbios en el nombre de cluster. A partir de ahi no tuve mas problemas. Ahora bien no logro encontrar informacion de porque pasa esto.

    Me podes pasar informacion de las posibles causas, porque no encontre informacion al respecto, solo si ocurria esto, aplique tal cosa.

    Saludos!

    Ale


    Alejandro | Especialista en Infraestructura Microsoft |
    jueves, 2 de junio de 2011 15:43

Todas las respuestas

  • Qué servidor tiene el Disk Witness? Porque el error que te da es que no puede localizar el "quorum" y no se puede levantar.

    Appendix A: Details of How Quorum Works in a Failover Cluster

    http://technet.microsoft.com/en-us/library/cc730649(WS.10).aspx


    Saludos,

    Marc
    MCSA/MCSE 2003
    MCITP: Enterprise Administrator (Windows Server 2008)
    MCITP: Enterprise Messaging Administrator (Microsoft Exchange 2007 & Exchange 2010)
    MCC: Microsoft Community Contributor 2011
    Citrix CCA
    jueves, 26 de mayo de 2011 8:41
    Moderador
  • hola Marc

    lo tiene el nodo que esta activo y funcionando como tal. Si a este lo reinicio el otro nodo no toma control y falla todo el sistema.

    Lei esto y lo tengo tildado. Igualmente esto esta desde el inicio del cluster y la validación la hace sin problemas. Tal vez el domingo haga esta tarea de destildarlo y ver que sucede, forzando el stop del servicio dentro del cluster al nodo que tiene el quorum.

    Viewing or changing the NetBIOS setting for an IP Address resource

    To view or change the NetBIOS setting for an IP Address resource:

    1. To open the failover cluster snap-in, click Start, click Administrative Tools, and then click Failover Cluster Management. If the User Account Control dialog box appears, confirm that the action it displays is what you want, and then click Continue.
    2. In the Failover Cluster Management snap-in, if the cluster you want to manage is not displayed, in the console tree, right-click Failover Cluster Management, click Manage a Cluster, and then select or specify the cluster that you want.
    3. If the console tree is collapsed, expand the tree under the cluster you want to manage, and then expand Services and Applications.
    4. In the console tree, click the clustered service or application that uses the IP Address resource that you want to check.
    5. In the center pane, expand the Name listing for the clustered service or application.
    6. Right-click the IP Address resource you want to check, and then click Properties.
    7. On the General tab, view, check, or clear the check box for Enable NetBIOS for this address.

    Alejandro | Especialista en Infraestructura Microsoft |
    jueves, 26 de mayo de 2011 13:36
  • Si fuerzas tú el balanceo, también da error?
    Saludos,

    Marc
    MCSA/MCSE 2003
    MCITP: Enterprise Administrator (Windows Server 2008)
    MCITP: Enterprise Messaging Administrator (Microsoft Exchange 2007 & Exchange 2010)
    MCC: Microsoft Community Contributor 2011
    Citrix CCA
    jueves, 26 de mayo de 2011 14:41
    Moderador
  • no nada, muestra un estado pending y luego comienza a fallar, mostrando esos dos eventos q te puse.

    gracias.


    Alejandro | Especialista en Infraestructura Microsoft |
    jueves, 26 de mayo de 2011 14:43
  • Puedes revisar que esta rama del registo HKLM/System/CurrentControlSet/Services/Clusdisk/Parameters sea igual en ambos nodos?

    Y otra cosa, el disco de quorum, es visible desde ambos servers? Es decir, está presentado correctamente a ambas máquinas?


    Saludos,

    Marc
    MCSA/MCSE 2003
    MCITP: Enterprise Administrator (Windows Server 2008)
    MCITP: Enterprise Messaging Administrator (Microsoft Exchange 2007 & Exchange 2010)
    MCC: Microsoft Community Contributor 2011
    Citrix CCA

    jueves, 26 de mayo de 2011 14:55
    Moderador
  • Segun releve no son iguales, precisas q lo copie aqui?

    No te entiendo que quieres decir con presentado en ambos nodos??

    gracias!

     


    Alejandro | Especialista en Infraestructura Microsoft |
    jueves, 26 de mayo de 2011 15:33
  • A lo primero, deberían ser iguales, pero de momento no toquemos nada que la podemos liar más.

    Respecto a lo segundo, el disco de quorum debe ser visible desde ambos servidores (estar presentado) de modo que sea este disco quien dice qué nodo es el activo y cual el pasivo (witness disk)

    En este link está explicado http://technet.microsoft.com/en-us/library/cc770620(WS.10).aspx y, diría, es el error que te marca.

     

    Del error de Netbios, en http://technet.microsoft.com/en-us/library/cc773470(WS.10).aspx mira el punto "Verifying that an IP Address resource can come online"


    Saludos,

    Marc
    MCSA/MCSE 2003
    MCITP: Enterprise Administrator (Windows Server 2008)
    MCITP: Enterprise Messaging Administrator (Microsoft Exchange 2007 & Exchange 2010)
    MCC: Microsoft Community Contributor 2011
    Citrix CCA
    jueves, 26 de mayo de 2011 16:09
    Moderador
  • Hola,

    Respecto a evento de netbios, el domingo voy a hacer ese cambio. Sabes a que se debe eso? no lo termino de comprender o bien detectar.

    Ahi encontre este error "The Cluster Service service terminated with service-specific error 5925 (0x1725)."

    http://support.microsoft.com/kb/975486 Lei esta nota, pero no aplica a mi modo de Quorum.

    gracias.


    Alejandro | Especialista en Infraestructura Microsoft |
    viernes, 27 de mayo de 2011 14:34
  • Alguna novedad?
    Saludos,

    Marc
    MCSA/MCSE 2003
    MCITP: Enterprise Administrator (Windows Server 2008)
    MCITP: Enterprise Messaging Administrator (Microsoft Exchange 2007 & Exchange 2010)
    MCC: Microsoft Community Contributor 2011
    Citrix CCA
    martes, 31 de mayo de 2011 18:49
    Moderador
  • hola Marc,

    Lo resolvio destildando el uso de netbios en el nombre de cluster. A partir de ahi no tuve mas problemas. Ahora bien no logro encontrar informacion de porque pasa esto.

    Me podes pasar informacion de las posibles causas, porque no encontre informacion al respecto, solo si ocurria esto, aplique tal cosa.

    Saludos!

    Ale


    Alejandro | Especialista en Infraestructura Microsoft |
    jueves, 2 de junio de 2011 15:43