none
Проблема с Lync 2013, при пропадании связи между сайтами RRS feed

  • Вопрос

  • Привет!

    Коллеги, необходим ваш совет. 

    В топологии Lync 2013 созданы два сайта , которые географически расположены в разных странах. В сайте A Front-end Enterprice pool, Edge. В сайте B только Front-end Standard Edition. CMS расположен в сайте А. Между сайтами VPN канал. В сайте B используют Edge из сайта А. SIP-домен одинаковый для обоих сайтов.

    Проблема в следующем. Падает VPN канал между сайтами и позднее от администратора сайта B я узнаю, что у них не работал Lync вообще. По его словам, при падении канала, сначала произошел дисконект клиента, после этого клиент подключился, но сообщения не отправлялись. 

    В логах на сервере в сайте B вижу следующие события:

    LS Replica Replicator Agent Service EventID 3042: 

    The replication of certificates from the central management store to the local machine failed due to an unexpected exception. Microsoft Lync Server 2013, Replica Replicator Agent will continuously attempt to retry the replication. While this condition persists, the certificates on the local machine will not be updated.

    Exception: System.DirectoryServices.ActiveDirectory.ActiveDirectoryOperationException: Unknown error (0x80005000) ---> System.Runtime.InteropServices.COMException: Unknown error (0x80005000)
       at System.DirectoryServices.DirectoryEntry.Bind(Boolean throwIfFail)
       at System.DirectoryServices.DirectoryEntry.Bind()
       at System.DirectoryServices.DirectoryEntry.get_AdsObject()
       at System.DirectoryServices.PropertyValueCollection.PopulateList()
       at System.DirectoryServices.PropertyValueCollection..ctor(DirectoryEntry entry, String propertyName)
       at System.DirectoryServices.PropertyCollection.get_Item(String propertyName)
       at System.DirectoryServices.ActiveDirectory.PropertyManager.GetPropertyValue(DirectoryContext context, DirectoryEntry directoryEntry, String propertyName)
       --- End of inner exception stack trace ---
       at System.DirectoryServices.ActiveDirectory.PropertyManager.GetPropertyValue(DirectoryContext context, DirectoryEntry directoryEntry, String propertyName)
       at System.DirectoryServices.ActiveDirectory.DirectoryEntryManager.ExpandWellKnownDN(WellKnownDN dn)
       at System.DirectoryServices.ActiveDirectory.Domain.GetDirectoryEntry()
       at Microsoft.Rtc.Management.Internal.KeyManagement.GroupKeyFactory.GetRootDomain()
       at Microsoft.Rtc.Management.Internal.KeyManagement.GroupKeyFactory..ctor()
       at Microsoft.Rtc.Management.Deployment.Core.Certificate.ReplicateCMSCertificates(IScopeAnchor scope)

    LS Replica Replicator Agent Service EventID 3037

    Windows Task Scheduler task for replication of certificates from the central management store to the local machine has failed to run. Microsoft Lync Server 2013, Replica Replicator Agent will continuously attempt to re-initialize the task. While this condition persists, no replication of the certificates from the central management store to the local machine will be done.

    Condition: Error returned by the certificate replication task.
     Detail: Unknown error (0xffffffff)
    Cause: Windows Task Scheduler may not be running or certificate replication task may have been deleted or disabled.
    Resolution:
    Ensure that Windows Task Scheduler service is running and certificate replication task is enabled.

    Почему перестал работать Lync локально в сайте B? Что нужно сделать, чтобы подобная проблема на повторилась?


    1 августа 2014 г. 11:38

Ответы

  • Вы же сами ответили на свой вопрос. Пропадание линка между сайтами, в результате чего пользователи второго сайта остаются без Lync - и есть вопрос отказоустойчивости. В вашем случае, CMS (скорее всего) размещается в back-end пуле (Enterprise) первого сайта, соответственно FrontEnd второго пытается реплицировать информацию из CMS на себя, но поскольку связи нет - валятся ошибки и FrontEnd считает, что он неработоспособен, поэтому пользователи не могут подключиться.

    В ваших условиях, скорее всего (необходимо дополнительно тестировать) во втором сайте должен быть Lync Server Standard Edition  выполняющий роль Backup Registrar. В этом случае, при падении связи между сайтами, он может взять на себя роль Registrar (переключение производится вручную, так же как и перепривязка пользователей к пулу Lync). К тому же функционал, доступный пользователям будет сильно ограничен.


    Do not multiply entities beyond what is necessary

    4 августа 2014 г. 3:44

Все ответы

  • Не похоже, что ваша топология (вернее ее исполнение) поддерживается в разрезе отказоустойчивости. Внимательно посмотрите статью по этому вопросу.

    Do not multiply entities beyond what is necessary

    1 августа 2014 г. 12:44
  • День добрый.

    Чтобы такое не повторялось, надо читать Planning for high availability and disaster recovery in Lync Server 2013, делать выводы и менять архитектуру.


    MCITP, MCSE. Знание - не уменьшает нашей глупости. Все данные приведены в виде примера и не адаптированы для вашей системы. Выполнения командлетов и внесения изменений в систему, делаете ВЫ. Все вопросы по привязке примера к вашей ситуации или адаптации решения, рассматриваются, только через заявку или кейс в техническую поддержку.

    1 августа 2014 г. 12:46
    Модератор
  • У меня нет отказоустойчивости между сайтам, да она и не нужна. У меня в сайте A отказоустойчивость для сайта А реализована поднятием Enterprice Pool, в сайте B вообще нет отказоустойчивости. 

    Проблема в том, что при пропадании связи между сайтами, в сайте B перестал работать Lync. Судя по логам, потому что был недоступен CMS. Но CMS должен быть один на всю топологию. Или я не прав?

    1 августа 2014 г. 12:53
  • Коллеги,

    все ссылки что вы приводите, относятся к отказоустойчивости между сайтами Lync. У меня этого нет и не требуется.

    Даже если бы была отказоустойчивость, как в приведенных ссылках, это не помогло. У меня не падал пул ни в одном из сайтов. Не было связи между пулами.

    1 августа 2014 г. 13:42
  • Вы же сами ответили на свой вопрос. Пропадание линка между сайтами, в результате чего пользователи второго сайта остаются без Lync - и есть вопрос отказоустойчивости. В вашем случае, CMS (скорее всего) размещается в back-end пуле (Enterprise) первого сайта, соответственно FrontEnd второго пытается реплицировать информацию из CMS на себя, но поскольку связи нет - валятся ошибки и FrontEnd считает, что он неработоспособен, поэтому пользователи не могут подключиться.

    В ваших условиях, скорее всего (необходимо дополнительно тестировать) во втором сайте должен быть Lync Server Standard Edition  выполняющий роль Backup Registrar. В этом случае, при падении связи между сайтами, он может взять на себя роль Registrar (переключение производится вручную, так же как и перепривязка пользователей к пулу Lync). К тому же функционал, доступный пользователям будет сильно ограничен.


    Do not multiply entities beyond what is necessary

    4 августа 2014 г. 3:44
  • Да, вы правы CMS размещен на back-end пуле первого сайта. На сколько я понимаю, Backup pool должен быть той же версии, что и основной. Т.е. я не могу совместить Enterprice и Standard. 

    Таким образом, мне нужно поднимать в сайте B тоже Enterprice pool и делать его резервным?

    4 августа 2014 г. 6:56
  • Вы совершенно правильно поняли :) По крайней мере в документации именно такая топология описывается.

    Do not multiply entities beyond what is necessary

    4 августа 2014 г. 7:05
  • Рекомендую прослушать лекцию.

    LyncConf2014 - SERV402 - Lync 2013 High Availability and Disaster Recovery


    MCITP, MCSE. Знание - не уменьшает нашей глупости. Все данные приведены в виде примера и не адаптированы для вашей системы. Выполнения командлетов и внесения изменений в систему, делаете ВЫ. Все вопросы по привязке примера к вашей ситуации или адаптации решения, рассматриваются, только через заявку или кейс в техническую поддержку.

    4 августа 2014 г. 8:25
    Модератор