none
Lync 2013 проблема Front-end RRS feed

  • Вопрос

  • Добрый день!

    В настоящий момент наблюдается проблема между двумя серверами собранными в пул. Проблема началась примерно два месяца назад. Запущены оба сервера, пользователи попадают на обои сервера идет балансировка, но они не видят друг друга в клиенте  Lync. В итоги пришлось отключить на одном из серверов сервисы Registrar и UserServer.Прошу подсказать,что могло привести к этому и на что обратить внимание в первую очередь для решения проблемы.

    p.s. Сертификаты обновлял.

    7 августа 2018 г. 8:31

Ответы

  • Надо смотреть подробнее смотреть логи (на обеих нодах). Там должны быть ещё события. Что с логами WindowsFabric на второй ноде?

    Так и не отписались по DNS, пингам, фаерволам/антивирусам.

    Ну и что ещё можно сделать. Запускать Lync Server 2013 Debugging Tools и смотреть там какие ошибки сыпятся.

    И вы писали что обновляли сертификаты. Напишите подробнее - что вы именно делали. На FE-серверах используете один и тот же сертификат? Пробегитесь по следующим проверкам на серверах: Checks to do in the Lync/Skype for Business Server Certificate Store

    На втором сервере в SQL-инстансе LYNCLOCAL имеется база LYSS? С ней все норм?

    • Помечено в качестве ответа BWD-01 16 августа 2018 г. 15:01
    15 августа 2018 г. 2:53
  • Возможно у Вас сертификаты не на своих местах. Могу конечно ошибаться...

    Но проверьте что бы в mmc-сертификаты, все сертификаты были на местах. Рутовые в рутовых, доверенные в доверенных.

    У меня как то было что они перемешались и не стартовали службы.

    • Помечено в качестве ответа BWD-01 16 августа 2018 г. 15:01
    15 августа 2018 г. 13:34
  • По клиентам. Чтобы разрешить интерфейс S4B для клиентов - нужно подправить политику клиентов (либо создать новую и накатить её на пользователей):

    Set-CsClientPolicy -identity <ваша политика> -EnableSkypeUI $true

    По вашей изначальной проблеме. Покажите какой сейчас вывод get-csPoolFabricState и get-csUserPoolInfo.


    • Изменено Anikin Alexander 17 августа 2018 г. 3:35
    • Помечено в качестве ответа BWD-01 17 августа 2018 г. 12:16
    17 августа 2018 г. 3:35
  • У вас всё равно пользователь регистрируется только на второй ноде в данном случае. В разделе PrimaryPoolMachinesInPreferredOrder должны быть указаны обе ноды. В PrimaryPoolPrimaryRegistrar - основная нода для данного пользователя. В PrimaryPoolBackupRegistrars - вторичная, запасная нода, а у вас там пусто. А всё потому что в группе маршрутизации для вашего пула пока что фигурирует только одна реплика:

    Replica Instances for Routing Service
        Address: VTO01-PIUCFE-N2 - Primary: 14 Secondary: 0

    Так что толку от Enterprise-пула пока что нет никакого)

    Вы перезагружали ваши сервера? Если нет - сделайте это. И пробуйте восстановить пул командлетом:

    Reset-CsPoolRegistrarState -ResetType QuorumLossRecovery -PoolFQDN <FQDN>

    Ждите когда всё перезапуститься, проверяйте - если не помогло, то фулл-ресет (смотрим при этом логи на предмет ошибок и предупреждений):

    reset-csPoolRegistrarState -poolFqdn <FQDN> -ResetType FullReset


    • Изменено Anikin Alexander 17 августа 2018 г. 7:20
    • Помечено в качестве ответа BWD-01 17 августа 2018 г. 12:16
    17 августа 2018 г. 7:17
  • На втором серваке похоже с базой какая то проблема:

    Ensure that connectivity to local database is proper. If the error persists, please contact product support with server traces.

    Вы запускали на нем Деплоймент визард?

    • Помечено в качестве ответа BWD-01 17 августа 2018 г. 12:16
    17 августа 2018 г. 11:06

Все ответы

  • Проверьте топологию, если все корректно то опубликуйте ее заново, в крайнем случае прогоните деплоймент визардом.

    А лучше всего смотрите логи Lync в журнале, на что ругается.

    7 августа 2018 г. 9:03
  • надеюсь два сервера в Enterprice пуле? 

    И два сервера не рекомендованная конфигурация, надо 3 и больше.

    7 августа 2018 г. 9:07
  • При попытке публикации:

    Warning: Unable to check the security for "Deleted Objects" in the configuration container. This is expected if you are not an enterprise administrator.

    7 августа 2018 г. 9:26
  • Для начала - опишите более детально свою инфраструктуру. Опишите прям всю свою топологию Lync чтоб мы не домысливали (FE-сервера, стоят ли апдейты, где и как расположен SQL, файловая шара, какие DNS-записи создали, какие внутренние и внешние URL-ы и тд). 

    Уже был задан вопрос - что за два сервера в пуле? Это Enterprise-пул, или два стандарта в PoolPairing? А может речь вообще а каком-то другом пуле.

    И опишите суть проблемы. Что значит не видят друг друга в клиенте? В поиске не могут найти? - если так, то это может быть проблема с адресной книгой. Если попытаться найти пользователя непосредственно по его SIP-URI (user@contoso.com) и написать/позвонить - всё нормально? Статус при этом отображается?

    В идеале - приложите скрины вашей серверной конфигурации и клиентской проблемы.

    По вашему последнему посту: "Warning: Unable to check the security for "Deleted Objects" in the configuration container. This is expected if you are not an enterprise administrator."

    Всё ж написано. Проверьте для начала - добавлен ли пользователь, из под которого запускаете TopologyBuilder - в Enterprise-админы в лесу AD.

    Судя по вашим знаниям - я бы крайне рекомендовал начать читать технет/докс по Lync/S4B.




    7 августа 2018 г. 10:12
  • Два сервера Front-end в enterprise edition front end pools.

    Один Mediation Server

    Два Edge сервера

    SQL Server

    File store  находиться на сервера SQL

    Один сервер Office Web apps Server.

    Суть проблемы: Если на двух серверах работают все службы Lync, в клиенте  пользователи если они находят на разных серверах не то что не видят друг друга, статус  пользователя которого ищут отображается не в сети.

    7 августа 2018 г. 10:34
  • enterprise administrator дайте учетной записи от имени которой публикуете топологию, мне кажется что у Вас один из фронтов вылетел из топологии.
    7 августа 2018 г. 11:27
  • Дал доступ, провел повторную публикацию. Публикация прошла без ошибок, но пользователи не синхронизируются друг с другом. Такое чувство что пользователи на разных серверах находятся.
    7 августа 2018 г. 12:23
  • В топологии, в пуле видно что 2 Фронт энд сервера?

    Попробуйте в не рабочее время прогнать Deploiment Wizard (мастер установки), на каждом сервере. Он найдет проблемы автоматически и так же их исправит.

    Но все же посмотрели бы Вы в начале логи

    7 августа 2018 г. 12:58
  • Да в топологии два все отлично, в логах кроме предупреждений о

    Insertion of an error report was throttled to prevent flooding of the Call Detail Recording (CDR) database.

     

    Component: CDR Adaptor

    Cause: This is an expected condition if too many error reports of the same type were reported at the same time.

    Resolution:

    No action is needed. A large enough number of error reports of this type have already been inserted into the database and can be used for troubleshooting and reporting. Additional errors are not inserted to avoid flooding of the database with redundant information.

    Остальное все синхронизируется.

    Если я запущу

    Deploiment Wizard  он разве не перезапишет? Как правильно сделать , что бы ничего не потерять.
    • Изменено BWD-01 7 августа 2018 г. 13:28
    7 августа 2018 г. 13:27
  • Вы ничего не потеряете, да он перезапишет. У вас вся конфигурация хранится в АД и в базе.

    Визард просто поправит конфигурацию серверов которая записана у Вас в AD (в топологии).

    Ну а там если возникнут ошибки, то будет что бороть...

    Запустите вначале на одном сервере, проверьте что все запустилось и работает на нем, потом проделайте тоже самое на втором сервере.

    PS после Пети приходилось восстанавливать имея только выжившую AD и бэкап базы. Деплоймент сам считывает топологию и конфигурит сервера.
    7 августа 2018 г. 13:59
  • На самом деле Lync/S4B в AD'шке практически ничего не хранит из конфигурации. Всё хранится в базе (оригинал в CMS - а с него разливается по другим пулам). В AD'шке имеется SCP, который указывает как раз где находится база.

    По вашей проблеме - ответьте всё таки на вопрос. Если попытаться найти пользователя непосредственно по его SIP-URI (ivanov@contoso.com) - отправляются\доходят ли сообщения?

    Что по апдейтам? Проверьте оба сервера - может оказаться, что у вас фронты с разными CU. Ну и вообще может простое обновление исправит все проблемы.

    DeploymentWizard всегда будет полезно прогнать - он ничего лишнего не удалит (только если вы сами в топологии ничего не грохнули).

    Я бы начал пока с простого. Покажите вывод с каждого сервера: 

    get-csWindowsService

    Так же покажите вывод: 

    get-csManagementStoreReplicationStatus
    
    get-csPoolFabricState -PoolFqdn <FQDN вашего FE-пула>

    Есть ещё такой скриптик Lync system status script. Отправьте нам его отчет.



    8 августа 2018 г. 6:46
  • get-csWindowsService

    Running  W3SVC
    Running  MASTER
    Running  REPLICA
    Running  RTCCLSAGT
    Running  RTCSRV          Incoming Requests per Second=0,Messages in Server=0...
    Running  RTCATS          Current Active Calls=0
    Running  RTCIMMCU        Active Conferences=1,Connected Users=3
    Running  RTCDATAMCU      Active Conferences=0
    Running  RTCAVMCU        Number of Conferences=1,Number of Users=1
    Running  RTCASMCU        Active Conferences=1,Connected Users=18
    Running  RTCMEDSRV       Current Outbound Calls=0,Current Inbound Calls=0,Cu...
    Running  FTA
    Running  RTCXMPPTGW

    get-csManagementStoreReplicationStatus

    UpToDate           : True
    ReplicaFqdn        : -------------------------
    LastStatusReport   : 8/8/2018 9:54:47 AM
    LastUpdateCreation : 8/8/2018 9:54:44 AM
    ProductVersion     : 5.0.8308.556

    UpToDate           : True
    ReplicaFqdn        : ----------------------------
    LastStatusReport   : 8/8/2018 9:54:47 AM
    LastUpdateCreation : 8/8/2018 9:54:44 AM
    ProductVersion     : 5.0.8308.556

    UpToDate           : True
    ReplicaFqdn        : -----------------------------
    LastStatusReport   : 8/8/2018 9:54:46 AM
    LastUpdateCreation : 8/8/2018 9:54:44 AM
    ProductVersion     : 5.0.8308.556

    UpToDate           : True
    ReplicaFqdn        : -------------------------
    LastStatusReport   : 8/8/2018 9:54:44 AM
    LastUpdateCreation : 8/8/2018 9:54:44 AM
    ProductVersion     : 5.0.8308.556

    get-csPoolFabricState -PoolFqdn  -----------------

    get-csPoolFabricState : Failed to connect to any machine in Pool
    CTO01-PIUCFE-01
    At line:1 char:1
    + get-csPoolFabricState -PoolFqdn CTO01-PIUCFE-01
    + ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
        + CategoryInfo          : InvalidOperation: (:) [Get-CsPoolFabricState], E
       xception
        + FullyQualifiedErrorId : Error getting fabric state. For details, see inn
       er exception.,Microsoft.Rtc.Management.HADR.GetOcsPoolFabricStateCmdlet

    8 августа 2018 г. 7:55
  • get-csWindowsService - с каждого сервера!

    get-csPoolFabricState - там нужно указать FQDN имя пула (не отдельного FE-сервера), а не короткое имя. Что-то вроде CTO01-PIUCFE-01.contoso.com



    8 августа 2018 г. 8:02
  • Снимаю с пула.

    Второй фронт

    get-csWindowsService

    Status   Name            ActivityLevel
    ------   ----            -------------
    Running  W3SVC
    Running  MASTER
    Running  REPLICA
    Running  RTCCLSAGT
    Running  RTCSRV          Incoming Requests per Second=0,Messages in Server=0..
    Running  RTCATS          Current Active Calls=0
    Running  RTCIMMCU        Active Conferences=0,Connected Users=0
    Running  RTCDATAMCU      Active Conferences=0
    Running  RTCAVMCU        Number of Conferences=1,Number of Users=0
    Running  RTCASMCU        Active Conferences=0,Connected Users=0
    Running  RTCMEDSRV       Current Outbound Calls=0,Current Inbound Calls=0,Cu..
    Running  FTA
    Running  RTCXMPPTGW

    get-csManagementStoreReplicationStatus

    UpToDate           : True
    ReplicaFqdn        : VTO01-PIUCED-N1.
    LastStatusReport   : 08.08.2018 9:54:47
    LastUpdateCreation : 08.08.2018 9:54:44
    ProductVersion     : 5.0.8308.556

    UpToDate           : True
    ReplicaFqdn        : VTO01-PIUCED-N2
    LastStatusReport   : 08.08.2018 9:54:47
    LastUpdateCreation : 08.08.2018 9:54:44
    ProductVersion     : 5.0.8308.556

    UpToDate           : True
    ReplicaFqdn        : VTO01-PIUCFE-N1.
    LastStatusReport   : 08.08.2018 9:54:46
    LastUpdateCreation : 08.08.2018 9:54:44
    ProductVersion     : 5.0.8308.556

    UpToDate           : True
    ReplicaFqdn        : VTO01-PIUCFE-N2
    LastStatusReport   : 08.08.2018 11:10:46
    LastUpdateCreation : 08.08.2018 11:10:43
    ProductVersion     : 5.0.8308.556

    Replica Instances for MCUFactory Service
        Address: VTO01-PIUCFE-N1. - Primary: 6 Secondary: 0


    Replica Instances for ConferenceDirectory Service
        Address: VTO01-PIUCFE-N1 - Primary: 1 Secondary: 0


    Replica Instances for Routing Service
        Address: VTO01-PIUCFE-N1 - Primary: 14 Secondary: 0
            Local Groups: Primary: 14 Secondary: 0
            Remote Groups: Primary: 0 Secondary: 0


    Replica Instances for LYSS Service
        Address: VTO01-PIUCFE-N1 - Primary: 14 Secondary: 0


    • Изменено BWD-01 8 августа 2018 г. 8:31
    8 августа 2018 г. 8:25
  • Где вывод get-csPoolFabriccState? Судя по всему - снизу вашего сообщения. Вы помечайте это. Тяжело ваши сообщения читать и домысливать.

    Покажите ещё вывод:

    get-csPool <FQDN FE-пула> get-cscomputer <FQDN первой ноды> get-cscomputer <FQDN второй ноды>

    и ещё раз для верности: get-csPoolFabricState <FQDN FE-пула>

    покажите ещё: nslookup <FQDN FE-пула>

    Пока всё говорит о том, что в пуле у вас только одна нода "VTO01-PIUCFE-N1"

    И постарайтесь отвечать на все вопросы, которые вам задают. А не выборочно. В сообщениях выше остались вопросы без ответов.


    8 августа 2018 г. 9:52
  • get-csPool :

    1 Сервер:Identity       : CTO01-PIUCFE-01
    Services       : {UserServer:CTO01-PIUCFE-01,
                     Registrar:CTO01-PIUCFE-01,
                     WebServer:CTO01-PIUCFE-01,
                     ConferencingServer:CTO01-PIUCFE-01...}
    Computers      : {VTO01-PIUCFE-N1, VTO01-PIUCFE-N2}
    Fqdn           : CTO01-PIUCFE-01
    BackupPoolFqdn :
    Site           : Site:TNO Site 01

    2.Сервер

    Identity       : CTO01-PIUCFE-01
    Services       : {UserServer:CTO01-PIUCFE-01,
                     Registrar:CTO01-PIUCFE-01,
                     WebServer:CTO01-PIUCFE-01,
                     ConferencingServer:CTO01-PIUCFE-01...}
    Computers      : {VTO01-PIUCFE-N1, VTO01-PIUCFE-N2}
    Fqdn           : CTO01-PIUCFE-01
    BackupPoolFqdn :
    Site           : Site:TNO Site 01

    get-cscomputer

    1. Сервер

    Identity : VTO01-PIUCFE-N1
    Pool     : CTO01-PIUCFE-01
    Fqdn     : VTO01-PIUCFE-N1

    Identity : VTO01-PIUCFE-N2
    Pool     : CTO01-PIUCFE-01
    Fqdn     : VTO01-PIUCFE-N2

    Identity : CTO01-PIUCSQL01.
    Pool     : CTO01-PIUCSQL01
    Fqdn     : CTO01-PIUCSQL01

    Identity : VTO01-PIUCWA-N1
    Pool     : VTO01-PIUCWA-N1
    Fqdn     : VTO01-PIUCWA-N1

    Identity : VTO01-PIUCED-N1
    Pool     : CTO01-PIUCED-01
    Fqdn     : VTO01-PIUCED-N1

    Identity : VTO01-PIUCED-N2
    Pool     : CTO01-PIUCED-01
    Fqdn     : VTO01-PIUCED-N2.

    2.Сервер

    Identity : VTO01-PIUCFE-N1
    Pool     : CTO01-PIUCFE-01
    Fqdn     : VTO01-PIUCFE-N1

    Identity : VTO01-PIUCFE-N2
    Pool     : CTO01-PIUCFE-01
    Fqdn     : VTO01-PIUCFE-N2

    Identity : CTO01-PIUCSQL01
    Pool     : CTO01-PIUCSQL01
    Fqdn     : CTO01-PIUCSQL01

    Identity : VTO01-PIUCWA-N1
    Pool     : VTO01-PIUCWA-N1
    Fqdn     : VTO01-PIUCWA-N1

    Identity : VTO01-PIUCED-N1
    Pool     : CTO01-PIUCED-01
    Fqdn     : VTO01-PIUCED-N1

    Identity : VTO01-PIUCED-N2
    Pool     : CTO01-PIUCED-01
    Fqdn     : VTO01-PIUCED-N2

    get-csPoolFabricState:

    В посте выше на первом сервере ошибка с второго я прислал ответ.

    NSLOOKUP

    В ответе вывел, что под пулом
    CTO01-PIUCFE-01 два ip адреса, именно обоих серваков.

    Скриптом не воспользовался. Обновления не все стоят. Возможно ,что обновления за прошлый год смогу поправить эти проблемы?

    8 августа 2018 г. 10:14
  • Т.е. одна и та же команда (get-csPoolFabricState) возвращает ошибку на первом сервере, и отрабатывает на втором? Проблем с DNS на серверах нет? Фаерволы/антивирусы включены? - попробуйте на время их отключить на всех серверах (в том числе и на SQL). Пинги с FE-серверов друг на друга по DNS-имени проходят? Имя пула корректно резолвится на первом и втором сервере? Бывает люди прописывают какую-нибудь хрень в HOSTS, а потом благополучно про это забывают. Проверьте все эти моменты - может получится, что у вас обычные сетевые проблемы.

    Смотрите логи серверов - на предмет чего-то интересного. При чем не только логи LyncServer - гляньте ошибки/предупреждения по всем логам. В сервисных логах на FE-серверах проверьте лог "Windows Fabric".

    Сервера естественно пробовали перезагружать? Обычно это одно из первых действий)) Рестартаните их по очереди для чистоты эксперимента. Что бы я ещё посоветовал - попробуйте при работающих FE-серверах запустить:

    reset-csPoolRegistrarState -PoolFqdn <FQDN-FE-Pool>

    Дождитесь когда перезагрузятся службы на обоих серверах (get-cswindowsservice). После этого проверьте работу. В выводе командлета get-csPoolFabricState у нас в конечном итоге должны отображаться два FE-сервера. И покажите вывод:

    get-csUserPoolInfo <user@contoso.com>

    В качестве пользователя - укажите любого пользователя вашего пула.

    Если ресет пула нам не помог - пробуем фуллРесет:

    reset-csPoolRegistrarState -poolFqdn <FQDN-FE-Pool> -ResetType FullReset
    Так же дожидаетесь когда перезагрузятся службы на FE-серверах и проверяете get-csPoolFabricState


    Скриптом не воспользовался. Обновления не все стоят. Возможно ,что обновления за прошлый год смогу поправить эти проблемы?

    Возможно всё что угодно. Вообще обновления надо ставить регулярно. А при возникновении каких-либо проблем это практически действие №1. Качайте последний CU: Lync Server 2013 Cumulative Update KB 2809243. И устанавливайте согласно инструкции. Не забудьте про пункт с обновлением БД (использую командлет install-csDatabase).

    И просьба - попробовать все рекомендации что написал выше и так же по пунктам отписаться.



    9 августа 2018 г. 4:08
  • После полного сброса:

    1. Сервак взял на себя пользователей

    2. Сервак не запускаеться служба RTCSRV

    В логах :

    Unexpected exception occurred in the Data Collection Agent.

     

    Exception: System.ServiceModel.EndpointNotFoundException: Not able to connect LYSS. Fqdn =

     

    Server stack trace:

       at Microsoft.Rtc.Server.DataCollection.Lib.StorageWrapper.InternalEnqueueMessages(String targetFqdn, List`1 batchMessages)

       at System.Runtime.Remoting.Messaging.StackBuilderSink._PrivateProcessMessage(IntPtr md, Object[] args, Object server, Object[]& outArgs)

       at System.Runtime.Remoting.Messaging.StackBuilderSink.AsyncProcessMessage(IMessage msg, IMessageSink replySink)

     

    Exception rethrown at [0]:

       at System.Runtime.Remoting.Proxies.RealProxy.EndInvokeHelper(Message reqMsg, Boolean bProxyCase)

       at System.Runtime.Remoting.Proxies.RemotingProxy.Invoke(Object NotUsed, MessageData& msgData)

       at Microsoft.Rtc.Server.DataCollection.Lib.AsyncEnqueueMessages.EndInvoke(IAsyncResult result)

       at Microsoft.Rtc.Server.DataCollection.Lib.StorageWrapper.<>c__DisplayClass3.<EnqueueMessages>b__2(IAsyncResult a)

    Cause: Internal error.

    Resolution:

    If the problem persists, notify your organization's support team with the relevant details.

    10 августа 2018 г. 8:32
  • И просьба - попробовать все рекомендации что написал выше и так же по пунктам отписаться.

    Ещё раз это процитирую. Я вам задал достаточно много вопросов и дал несколько рекомендаций - вы отвечаете только по одному моменту.

    Если вам не хочется разбираться с проблемой - есть 100% рабочий вариант. Добавляете новый сервер в пул, а старый удаляете.

    Либо ещё можно попробовать удалить из топологии глючный сервер - запустить DeploymentWizard, чтобы он удалил все ненужные компоненты. А после этого обратно добавить его в топологии и запустить установку. Вполне возможно проблемы уйдут.



    10 августа 2018 г. 8:58
  • 1. reset-csPoolRegistrarState -PoolFqdn <FQDN-FE-Pool>

    После перезапуска не дал результат, сервис перезапустились. 1 сервер поднялся на втором служба RtcSrv  не поднимается  в логах пишет:

    An exception caused the process to stop.

     Exception Details. System.ApplicationException: Failed to start Fabric Pool Manager.

       at Microsoft.Rtc.AppDomainHost.Launcher.Initialize(String[] args)

       at Microsoft.Rtc.AppDomainHost.Launcher.Main(String[] args)

    Cause: Check the eventlog description.

    Resolution:

    Examine prior event log entries to find and resolve the problem. If the problem persists contact product support.

    get-csUserPoolInfo <user@contoso.com>:

    Replica Instances for MCUFactory Service
        Address: VTO01-PIUCFE-N1 - Primary: 6 Secondary: 0


    Replica Instances for ConferenceDirectory Service
        Address: VTO01-PIUCFE-N1 - Primary: 1 Secondary: 0


    Replica Instances for Routing Service
        Address: VTO01-PIUCFE-N1 - Primary: 14 Secondary: 0
            Local Groups: Primary: 14 Secondary: 0
            Remote Groups: Primary: 0 Secondary: 0

    Replica Instances for LYSS Service
        Address: VTO01-PIUCFE-N1 - Primary: 14 Secondary: 0

    reset-csPoolRegistrarState -poolFqdn <FQDN-FE-Pool> -ResetType FullReset

    Тоже сделал  не помогло, произошел полный сброс. Сервис восстановились только на одном на втором не поднялась одна служба.

    Апдейты выставлены.

    install-csDatabase тоже сделал.

    Вариант с удалением из топологии не получился. По возвращению обратно точно также не поднимается этот сервис.


    • Изменено BWD-01 14 августа 2018 г. 14:51
    14 августа 2018 г. 9:13
  • Надо смотреть подробнее смотреть логи (на обеих нодах). Там должны быть ещё события. Что с логами WindowsFabric на второй ноде?

    Так и не отписались по DNS, пингам, фаерволам/антивирусам.

    Ну и что ещё можно сделать. Запускать Lync Server 2013 Debugging Tools и смотреть там какие ошибки сыпятся.

    И вы писали что обновляли сертификаты. Напишите подробнее - что вы именно делали. На FE-серверах используете один и тот же сертификат? Пробегитесь по следующим проверкам на серверах: Checks to do in the Lync/Skype for Business Server Certificate Store

    На втором сервере в SQL-инстансе LYNCLOCAL имеется база LYSS? С ней все норм?

    • Помечено в качестве ответа BWD-01 16 августа 2018 г. 15:01
    15 августа 2018 г. 2:53
  • Ответ по базе LYSS: Честно не могу понять пишет ошибку:

    Unexpected exception occurred in the Data Collection Agent.

     

    Exception: System.ServiceModel.EndpointNotFoundException: Not able to connect LYSS. Fqdn =

     

    Server stack trace:

       at Microsoft.Rtc.Server.DataCollection.Lib.StorageWrapper.InternalEnqueueMessages(String targetFqdn, List`1 batchMessages)

       at System.Runtime.Remoting.Messaging.StackBuilderSink._PrivateProcessMessage(IntPtr md, Object[] args, Object server, Object[]& outArgs)

       at System.Runtime.Remoting.Messaging.StackBuilderSink.AsyncProcessMessage(IMessage msg, IMessageSink replySink)

     

    Exception rethrown at [0]:

       at System.Runtime.Remoting.Proxies.RealProxy.EndInvokeHelper(Message reqMsg, Boolean bProxyCase)

       at System.Runtime.Remoting.Proxies.RemotingProxy.Invoke(Object NotUsed, MessageData& msgData)

       at Microsoft.Rtc.Server.DataCollection.Lib.AsyncEnqueueMessages.EndInvoke(IAsyncResult result)

       at Microsoft.Rtc.Server.DataCollection.Lib.StorageWrapper.<>c__DisplayClass3.<EnqueueMessages>b__2(IAsyncResult a)

    Cause: Internal error.

    Resolution:

    If the problem persists, notify your organization's support team with the relevant details.

     
    15 августа 2018 г. 11:53
  • Фаервол полностью отключен.

    Антивирус отключал.

    15 августа 2018 г. 13:22
  • Возможно у Вас сертификаты не на своих местах. Могу конечно ошибаться...

    Но проверьте что бы в mmc-сертификаты, все сертификаты были на местах. Рутовые в рутовых, доверенные в доверенных.

    У меня как то было что они перемешались и не стартовали службы.

    • Помечено в качестве ответа BWD-01 16 августа 2018 г. 15:01
    15 августа 2018 г. 13:34
  • Всем спасибо!

    Серваки заработали.

    Только теперь выдает вот такие ошибки :

    The following Fabric service for routing groups have been closed:

    {9D194BEA-A861-5442-8CC7-02DA4CFB0317}

    {1D0FE695-FDA9-5FA9-B175-381BD1ED1025}

    И второе клиенты lync 2013 были  skype for Business. А сейчас стало Lync.

    Как вернуть обратно, вроде как нужно сделать политику, но если она уже была создана.

    ХЭЛП!

    Заранее все спасибо.

    16 августа 2018 г. 15:01
  • По клиентам. Чтобы разрешить интерфейс S4B для клиентов - нужно подправить политику клиентов (либо создать новую и накатить её на пользователей):

    Set-CsClientPolicy -identity <ваша политика> -EnableSkypeUI $true

    По вашей изначальной проблеме. Покажите какой сейчас вывод get-csPoolFabricState и get-csUserPoolInfo.


    • Изменено Anikin Alexander 17 августа 2018 г. 3:35
    • Помечено в качестве ответа BWD-01 17 августа 2018 г. 12:16
    17 августа 2018 г. 3:35

  •  get-csPoolFabricState

    cmdlet Get-CsPoolFabricState at command pipeline position 1
    Supply values for the following parameters:
    PoolFqdn: cTO01-PIUCFE-01


    Replica Instances for MCUFactory Service
        Address: VTO01-PIUCFE-N1 - Primary: 3 Secondary: 3
        Address: VTO01-PIUCFE-N2 - Primary: 3 Secondary: 3


    Replica Instances for ConferenceDirectory Service
        Address: VTO01-PIUCFE-N1 - Primary: 0 Secondary: 1
        Address: VTO01-PIUCFE-N2- Primary: 1 Secondary: 0


    Replica Instances for Routing Service
        Address: VTO01-PIUCFE-N2 - Primary: 14 Secondary: 0
            Local Groups: Primary: 14 Secondary: 0
            Remote Groups: Primary: 0 Secondary: 0


    Replica Instances for LYSS Service
        Address: VTO01-PIUCFE-N1 - Primary: 0 Secondary: 14
        Address: VTO01-PIUCFE-N2 - Primary: 14 Secondary: 0


    Global Service Count Summary:
    Fqdn: VTO01-PIUCFE-N1 - Primary: 3 Secondary: 18
    Fqdn: VTO01-PIUCFE-N2 - Primary: 32 Secondary: 3

     get-csUserPoolInfo CTO01-PIUCFE-01

    PS C:\Windows\system32> get-csUserPoolInfo

    cmdlet Get-CsUserPoolInfo at command pipeline position 1
    Supply values for the following parameters:
    Identity: -----------


    Identity                            : ------------
    PrimaryPoolFQDN                     : CTO01-PIUCFE-01
    BackupPoolFQDN                      :
    UserServicesPoolFQDN                : CTO01-PIUCFE-01
    PrimaryPoolMachinesInPreferredOrder : {vto01-piucfe-n2}
    BackupPoolMachinesInPreferredOrder  : {}
    PrimaryPoolPrimaryRegistrar         : vto01-piucfe-n2
    PrimaryPoolBackupRegistrars         : {}
    PrimaryPoolPrimaryUserService       : vto01-piucfe-n2
    PrimaryPoolBackupUserServices       : {}
    BackupPoolPrimaryRegistrar          :
    BackupPoolBackupRegistrars          : {}
    BackupPoolPrimaryUserService        :
    BackupPoolReplicaUserServices       : {}




    • Изменено BWD-01 17 августа 2018 г. 6:47
    17 августа 2018 г. 5:53
  • У вас всё равно пользователь регистрируется только на второй ноде в данном случае. В разделе PrimaryPoolMachinesInPreferredOrder должны быть указаны обе ноды. В PrimaryPoolPrimaryRegistrar - основная нода для данного пользователя. В PrimaryPoolBackupRegistrars - вторичная, запасная нода, а у вас там пусто. А всё потому что в группе маршрутизации для вашего пула пока что фигурирует только одна реплика:

    Replica Instances for Routing Service
        Address: VTO01-PIUCFE-N2 - Primary: 14 Secondary: 0

    Так что толку от Enterprise-пула пока что нет никакого)

    Вы перезагружали ваши сервера? Если нет - сделайте это. И пробуйте восстановить пул командлетом:

    Reset-CsPoolRegistrarState -ResetType QuorumLossRecovery -PoolFQDN <FQDN>

    Ждите когда всё перезапуститься, проверяйте - если не помогло, то фулл-ресет (смотрим при этом логи на предмет ошибок и предупреждений):

    reset-csPoolRegistrarState -poolFqdn <FQDN> -ResetType FullReset


    • Изменено Anikin Alexander 17 августа 2018 г. 7:20
    • Помечено в качестве ответа BWD-01 17 августа 2018 г. 12:16
    17 августа 2018 г. 7:17
  • Recovery не помог.

    Был сделан полный Reset

    reset-csPoolRegistrarState : FabricHostSvc service at machine VTO01-PIUCFE-N2.T
    NO.TN.CORP not yet in Stopped state, time expired.
    At line:1 char:1
    + reset-csPoolRegistrarState -poolFqdn CTO01-PIUCFE-01-ResetType F
    ull ...
    + ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    ~~~
        + CategoryInfo          : InvalidOperation: (:) [Reset-CsPoolRegistrarStat
       e], Exception
        + FullyQualifiedErrorId : Error resetting fabric state. For details, see i
       nner exception.,Microsoft.Rtc.Management.Hadr.ResetPoolFabricStateCmdlet

    reset-csPoolRegistrarState : FabricHostSvc service at machine VTO01-PIUCFE-N2.T
    NO.TN.CORP not yet in Stopped state, time expired.
    At line:1 char:1
    + reset-csPoolRegistrarState -poolFqdn CTO01-PIUCFE-01.TNO.TN.CORP -ResetType F
    ull ...
    + ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    ~~~
        + CategoryInfo          : InvalidOperation: (:) [Reset-CsPoolRegistrarStat
       e], Exception
        + FullyQualifiedErrorId : Error resetting fabric state. For details, see i
       nner exception.,Microsoft.Rtc.Management.Hadr.ResetPoolFabricStateCmdlet

    Один из серваков отписал в логах:

    Pool Manager changed state of Registrar with FQDN: VTO01-PIUCFE-N2 to Active.

    На втором серваке :

    Store procedure to GET progress vector failed.

     

    Execution Error: 0xFFFFFFFF.

    Native Error: 0.

    Error Details: .

    Cause: This may indicate a problem with connectivity to local database or some unknown product issue.

    Resolution:

    Ensure that connectivity to local database is proper. If the error persists, please contact product support with server traces.


    • Изменено BWD-01 17 августа 2018 г. 10:35
    17 августа 2018 г. 10:24
  • После полного ресета постоянном меняется

    Replica Instances for Routing Service
        Address: VTO01-PIUCFE-N2 - Primary: 14 Secondary: 0
            Local Groups: Primary: 14 Secondary: 0
            Remote Groups: Primary: 0 Secondary: 0

    17 августа 2018 г. 10:26
  • На втором серваке похоже с базой какая то проблема:

    Ensure that connectivity to local database is proper. If the error persists, please contact product support with server traces.

    Вы запускали на нем Деплоймент визард?

    • Помечено в качестве ответа BWD-01 17 августа 2018 г. 12:16
    17 августа 2018 г. 11:06
  • Да запускал , с начало Install Local Configuration Store потом Setup or Remove Lync Server Component.

    Оба прошли без ошибок.

    17 августа 2018 г. 11:25
  • Спасибо за советы, накатил на второй сервак обновления и вот что выдает

    cmdlet Get-CsPoolFabricState at command pipeline position 1
    Supply values for the following parameters:
    PoolFqdn: CTO01-PIUCFE-01


    Replica Instances for MCUFactory Service
        Address: VTO01-PIUCFE-N1.- Primary: 6 Secondary: 0
        Address: VTO01-PIUCFE-N2.- Primary: 0 Secondary: 6


    Replica Instances for ConferenceDirectory Service
        Address: VTO01-PIUCFE-N1- Primary: 1 Secondary: 0
        Address: VTO01-PIUCFE-N2- Primary: 0 Secondary: 1


    Replica Instances for Routing Service
        Address: VTO01-PIUCFE-N1- Primary: 7 Secondary: 7
            Local Groups: Primary: 7 Secondary: 7
            Remote Groups: Primary: 0 Secondary: 0
        Address: VTO01-PIUCFE-N2.- Primary: 7 Secondary: 7
            Local Groups: Primary: 7 Secondary: 7
            Remote Groups: Primary: 0 Secondary: 0


    Replica Instances for LYSS Service
        Address: VTO01-PIUCFE-N1- Primary: 9 Secondary: 5
        Address: VTO01-PIUCFE-N2- Primary: 5 Secondary: 9


    Global Service Count Summary:
    Fqdn: VTO01-PIUCFE-N1- Primary: 23 Secondary: 12
    Fqdn: VTO01-PIUCFE-N2- Primary: 12 Secondary: 23

    17 августа 2018 г. 12:13
  • накатил на второй сервак обновления и вот что выдает

    Рекомендацию по обновлению сервером вам давали ещё в самом начале данного обсуждения. Хорошо, что хоть сейчас решились это сделать.

    Судя по выводу - всё ок. Покажите ещё вывод для get-csUserPoolInfo - там должны оба сервера теперь фигурировать.

    20 августа 2018 г. 3:50
  • Обновления я накатывал еще в начале, но после танцев с бубном и спасибо еще раз за все советы.

    Я удалил на больном серваке  Front End Server и Windows  Fabric. Потом Deployment установил по новой, после накатил обновления и заработало.

    Сегодня пришел на работу и политика применилась та что в 2013 заменяет Lync  клиент на S4B.

    Вывод команды:

    cmdlet Get-CsUserPoolInfo at command pipeline position 1
    Supply values for the following parameters:
    Identity: --------


    Identity                            : --------
    PrimaryPoolFQDN                     : CTO01-PIUCFE-01
    BackupPoolFQDN                      :
    UserServicesPoolFQDN                : CTO01-PIUCFE-01
    PrimaryPoolMachinesInPreferredOrder : {vto01-piucfe-n1, vto01-piucf
                                          e-n2}
    BackupPoolMachinesInPreferredOrder  : {}
    PrimaryPoolPrimaryRegistrar         : vto01-piucfe-n1
    PrimaryPoolBackupRegistrars         : {vto01-piucfe-n2}
    PrimaryPoolPrimaryUserService       : vto01-piucfe-n1
    PrimaryPoolBackupUserServices       : {vto01-piucfe-n2}
    BackupPoolPrimaryRegistrar          :
    BackupPoolBackupRegistrars          : {}
    BackupPoolPrimaryUserService        :
    BackupPoolReplicaUserServices       : {}


    • Изменено BWD-01 20 августа 2018 г. 6:50
    20 августа 2018 г. 6:49
  • Ну судя по всему всё ок. Клиенты, сидящие на разных FE-серверах теперь друг с другом нормально общаются? Состояние присутствия отображается?

    Если всё хорошо, то самое время теперь подумать о том, нужен ли такой FE-Enterprise пул из двух серверов. Как в самом начале вам говорили - пул из двух FE-серверов не рекомендуется:

    Topologies and components for Front End Servers, instant messaging, and presence in Lync Server 2013

    Front End pool with two Front End servers

    20 августа 2018 г. 7:17
  • Понимаю, но руководство не пойдет на выделение еще одного сервака.

    Да клиенты видят друг друга.

    20 августа 2018 г. 7:43
  • Ну в таком случае MS предлагает вообще не использовать Enterprise. А поставить два стандарта и настроить между ними PoolPairing.
    20 августа 2018 г. 7:53