none
Очень долгий ответ autodiscover.xml и чрезмерно долгий ответ RPC RRS feed

  • Общие обсуждения

  • После установки (предположительно!) CU 17 на Exchange 2010, через несколько дней, пользователи начали массово жаловаться на нестабильную почту. По факту это выглядело что в какой-то момент outlook разрывал соединение и начинал требовать пароль. То есть на сколько я понял Outlook теряет соединение по таймауту и начинает пробовать подключиться через SSL, для чего требует пароль. Перезапуск в некоторых случаях спасал, но по началу далеко не всегда. Через какое-то время клиент все равно мог отвалиться. Что характерно, outlook 2010 вел себя хуже всех и писал, что нет подключения е серверу в 100% случаях на тот момент.

    Никакие попытки понять что же происходит, результата не дали. Перезапуск сервера CAS тоже.

    Попробовал пересоздать Autodiscover. Субъективно проблема стала лучше, но это не точно и она определенно осталась. Со временем становилось лучше. Вероятно, повлияло распределение клиентов, которые запускаются и запущены и уменьшение RPC запросов на сервер при этом.

    Microsoft Connectivity Analyzer даже начал подключаться. До этого он сначала писал ошибку 1818 CallCancelled, затем после пересоздания autodiscover, начал завершаться по таймауту при попытке выполнить POST для автообнаружения

    На текущий момент почта работает, но довольно плохо. А иногда и перестает работать у некоторых людей. В том числе на компьютерах mac. Однако мобильные клиенты работают вроде бы стабильно, на них жалоб пока не поступало.

    В сухом остатке я определяю, что сервер как-то очень долго отвечает на RPC запросы, несмотря на то, что загрузка сервера очень низкая. Я смотрел perfmon по счетчикам RPC Average rate, RPC Packets/sec, например, значение почти все время по нулям, иногда подскакивает до десятка пакетов в секунду. RPC Average rate все время показывает 1. Что бы еще такого посмотреть, не знаю.

    У клиента при этом довольно высокое значение "ср.отв." Иногда достигает 8 секунд. В некоторых случаях, видимо, срабатывает таймаут и соединение отключается вообще.

    Microsoft Connectivity Analyzer иногда пишет про успешное подключение. но его время достаточно больше, на сколько я понял. Составляет где-то секунд 60 общего времени. Если не подключается, то пишет ошибку, где везде таймаут на одном и том же месте как я показывал выше.

    В общем что делать непонятно. Что посоветуете делать? Откатывать ли RU? Боюсь как бы не стало еще хуже. Почему exchange может отвечать на запросы на столько долго? В логах также ничего полезного не нашел.

Все ответы

  • Добрый день, странное поведение. Попробуйте какого то из клиентов проблемного перевести на mapi на Excahange 2010

    Для этого включите Mapi

    Set-OrganizationConfig -MapiHttpEnabled $true

    Переведите одного проблемного клиента

    Set-CASMailbox -Identity "Esther Valle" -MAPIEnabled $true

    Подождите пару часов, именно столько применяются правила. Потом посмотрите по какому протоколу работает клиент, протестируйте, дайте обратную связь

  • Добрый день, странное поведение. Попробуйте какого то из клиентов проблемного перевести на mapi на Excahange 2010

    Для этого включите Mapi

    Set-OrganizationConfig -MapiHttpEnabled $true

    Переведите одного проблемного клиента

    Set-CASMailbox -Identity "Esther Valle" -MAPIEnabled $true

    Подождите пару часов, именно столько применяются правила. Потом посмотрите по какому протоколу работает клиент, протестируйте, дайте обратную связь

    Этот параметр появился только в 2013 версии. У нас 2010.

    MAPIEnabled при этом включен по-умолчанию у клиентов.

    Дополню еще свое сообщение. Пробую делать test-outlookconnectivity -protocol:tcp, также большие задержки. Иногда опускаются до 20сек., но обычно около 40. Завершается тест не всегда. Иногда какие-то тесты пролетают за миллисекунды.


  • Глупость наверное спрошу. С сетью все в порядке? С сетевыми картами на сервере?

    Если Вам помог чей-либо ответ, пожалуйста, не забывайте жать на кнопку "Предложить как ответ" или "Проголосовать за полезное сообщение"

  • Ну так скажем, пинг стабильно низкий, рдп работает безупречно. Да и тот же test-outlookconnectivity выполнялся локально на сервере.
  • У вас какая конфигурация серверов?

    Балансировка используется?

    Если указать на клиенте адрес напрямую на сервер внутри сети проблема остается?

    В логах Exchange есть ошибки какие-нибудь?

    В логах IIS еще посмотрите


    scientia potentia est
    My blog

  • Есть 2 сервера, объединены в DAG, один из них CAS.

    Все на Windows server 2008. Используется Exchange server 2010 SP3 RU17

    Балансировки, соответственно, нет.

    Да, проблема остается. Касается всех клиентов и всех версий.

    В логах нет никаких аномалий.

    Из дополнений. Проблема как-то вроде бы связана с рабочими часами людей, но похоже что косвенно. Например, на прошлой неделе проблема встала в полный рост во вторник-среду. В этот момент test-outlookconnectivity tcp выдавал около 40-60сек ответа, а иногда тест вываливается с ошибкой. В какой-то момент сервер начинает более-менее сносно делать тест, сначала выдавая значения около 10сек, а затем и во все в пару сотен мс. Клиенты подключаются хорошо. Это было заметно в конце прошлой недели и на выходных. Сегодня проблема опять вернулась. Утром заметил, что outlook показывает среднее время ответа каталога в 500мс (вместо 10мс в конце прошлой недели), но заметной проблемы не заметил. Ближе к середине дня все стало как неделю назад: очень долгое подключение и не всегда завершающееся успешно. Отклик каталога в свойствах outlook выполняется за 8000-2000мс.

    При этом монитор производительности вроде бы не сообщает о каких-то проблемах:
    PRC Average Latency - 3ms
    Connection count - 357
    RPC Requests - 0
    RPC Packets/s - 15 (иногда увеличивается до 100, но average latency не увеличивается)
    RPC Operations/s - 350 (иногда возрастает до 1000, но average latency не увеличивается)

    CPU - около 10% (8 ядер)
    Диски - 0-20% активного времени.
    Память - 16G, Hard faults/s - 0
    Сеть - активность 10Мб/с

    Все значение мониторинга производительности заметно не отличаются от того времени, когда проблема не наблюдается или наблюдается меньше.

    Контроллеры домена также проверил, ничего необычного ни по загрузке ни по логам.

    Проблема, судя по всему, как-то связана с каталогом. Именно средний ответ до него в состоянии подключения становится чрезмерно высоким и составляет тысячи миллисекунд. Средний ответ от почты при этом составляет единицы мс.


  • Определил, что так или иначе, может быть косвенно, но проблема связана с пользователями. При отключении пользователей от сети, сервер начинает работать идеально. То есть test-outlookconnectivity начинает выполняться мгновенно. По мере подключения сегментов сети к серверу, в первую очередь начинает проседать "Autodiscover: Web service request." Остальные тесты проседают только через время. Тесты "Mailbox::Connect." и "Mailbox::Logon."становятся плохими последними. То есть подключение начинает выполняться дольше, но работа с сервером какое-то время нормальная, обращение к каталогу тоже. Потом и эти параметры вырастают с 15мс до 10000мс и работа становится плохой.

    Также заметил, что при отключении Default web site в IIS работа десктопных клиентов сразу же становится отличной.

    Исходя из этого пробовал отключить внешних клиентов, но это не дает результатов.

    Помимо прочего, из последних изменений в компании и того, что связывается с web службами exchange, это ip телефоны для skype for business. Но странно, учитывая что их пока не так и много и по статистике не видно, чтобы они как-то заметно много запрашивали данных с сервера. В среднем видно, что это какие-то не очень частые запросы.