none
Exchange 2010 sp2 DAG , один из серверов выпал из класера RRS feed

  • Вопрос

  • Добрый день!

    Просьба помочь разобраться:

    Есть два сервера exchange 2010 sp1, ОС - windows 2008 r2 sp1. Hostname - uranus07 и uranus08. И сервер свидетель wsus.

    uranus07 и сервер свидетель WSUS - принадлежат к сайту "HQ"

    uranus08 принадлежит к сайту "1905"

    Сегодня ночью произошел какой то трабл , в результате uranus08 выпал из кластера:

    [PS] C:\>Get-DatabaseAvailabilityGroup dag -Status | Format-List PrimaryActiveManager
    PrimaryActiveManager : URANUS07

    [PS] C:\>Get-DatabaseAvailabilityGroup | fl Name, Servers, WitnessServer, WitnessDirectory
    Name             : dag
    Servers          : {URANUS07, uranus08}
    WitnessServer    : wsus.devel.ifx
    WitnessDirectory : c:\witness_dag

    На uranus08 наблюдаем:

    event id 181 - No new cluster owner could be found.

    event id 174 - The cluster group is hosted on this server but the current role is Unknown. An attempt will be made to move the group.

    Вывод команды Test-ReplicationHealth | fl

    RunspaceId       : 1d77424c-9096-46a0-8861-6186f36ac012
    Server           : uranus08
    Check            : ClusterService
    CheckDescription : Checks if the cluster service is healthy.
    Result           : Passed
    Error            :
    Identity         :
    IsValid          : True

    RunspaceId       : 1d77424c-9096-46a0-8861-6186f36ac012
    Server           : uranus08
    Check            : ReplayService
    CheckDescription : Checks if the Microsoft Exchange Replication service is running.
    Result           : Passed
    Error            :
    Identity         :
    IsValid          : True

    RunspaceId       : 1d77424c-9096-46a0-8861-6186f36ac012
    Server           : uranus08
    Check            : ActiveManager
    CheckDescription : Checks that Active Manager is running and has a valid role.
    Result           : *FAILED*
    Error            : Active Manager is in an unknown state on server 'uranus08'. Basic database administrative operations
                        such as mounting or dismounting and the ability to have failovers or switchovers is not available.
                       Review the event logs for more details. Error: The server is not yet a fully operational member of t
                       he database availability group.
                       
    Identity         :
    IsValid          : True

    RunspaceId       : 1d77424c-9096-46a0-8861-6186f36ac012
    Server           : uranus08
    Check            : TasksRpcListener
    CheckDescription : Checks that the Tasks RPC Listener is running and is responding to remote requests.
    Result           : Passed
    Error            :
    Identity         :
    IsValid          : True

    RunspaceId       : 1d77424c-9096-46a0-8861-6186f36ac012
    Server           : uranus08
    Check            : TcpListener
    CheckDescription : Checks that the TCP Listener is running and is responding to requests.
    Result           : Passed
    Error            :
    Identity         :
    IsValid          : True

    RunspaceId       : 1d77424c-9096-46a0-8861-6186f36ac012
    Server           : uranus08
    Check            : DagMembersUp
    CheckDescription : Verifies that the members of a database availability group are up and running.
    Result           : *FAILED*
    Error            : Failures:
                           Server 'uranus08' is a member of database availability group 'dag' and is not up.
                           Server 'uranus07' is a member of database availability group 'dag' and is not up.
                       
    Identity         :
    IsValid          : True

    Вывод с uranus07



    RunspaceId       : cbcec2e8-c47d-4200-a8b9-f3670e95dc90
    Server           : URANUS07
    Check            : ClusterService
    CheckDescription : Checks if the cluster service is healthy.
    Result           : Passed
    Error            :
    Identity         :
    IsValid          : True

    RunspaceId       : cbcec2e8-c47d-4200-a8b9-f3670e95dc90
    Server           : URANUS07
    Check            : ReplayService
    CheckDescription : Checks if the Microsoft Exchange Replication service is running.
    Result           : Passed
    Error            :
    Identity         :
    IsValid          : True

    RunspaceId       : cbcec2e8-c47d-4200-a8b9-f3670e95dc90
    Server           : URANUS07
    Check            : ActiveManager
    CheckDescription : Checks that Active Manager is running and has a valid role.
    Result           : Passed
    Error            :
    Identity         :
    IsValid          : True

    RunspaceId       : cbcec2e8-c47d-4200-a8b9-f3670e95dc90
    Server           : URANUS07
    Check            : TasksRpcListener
    CheckDescription : Checks that the Tasks RPC Listener is running and is responding to remote requests.
    Result           : Passed
    Error            :
    Identity         :
    IsValid          : True

    RunspaceId       : cbcec2e8-c47d-4200-a8b9-f3670e95dc90
    Server           : URANUS07
    Check            : TcpListener
    CheckDescription : Checks that the TCP Listener is running and is responding to requests.
    Result           : Passed
    Error            :
    Identity         :
    IsValid          : True

    RunspaceId       : cbcec2e8-c47d-4200-a8b9-f3670e95dc90
    Server           : URANUS07
    Check            : DagMembersUp
    CheckDescription : Verifies that the members of a database availability group are up and running.
    Result           : *FAILED*
    Error            : Server 'uranus08' is a member of database availability group 'dag' and is not up.
                       
    Identity         :
    IsValid          : True


    Возможно ли что это так называемый split brain ?


    9 февраля 2015 г. 10:17

Ответы

Все ответы

  • На split brain непохоже (если вы, конечно, какое-то сообщение не забыли привести):  в сообщениях пишется, что uranus08 находится в состоянии Unknown. Судя по всему, потеряна связь по сети между узлами кластера.

    Для уверенности выполните команду

    cluster group "Cluster Group" /status на обоих серверах, и посмотрите, на каком узле, по мнению службы кластеров каждого из узлов, она активирована. Если только на uranus07, то никакого split brain нет.


    Слава России!

    9 февраля 2015 г. 17:22
  • Всем спасибо! Проблема решилась сменой ip проблемного uranus08.

    C дргуим ip uranus08 успешно перерегистрировался в кластере

    10 февраля 2015 г. 6:52