none
Отваливается подключение к Exchange 2010 RRS feed

  • Вопрос

  • Есть центральный офис с доменом, есть филиалы в 4х городах, все офисы находятся в одном домене. Сеть между ними объединена роутерами (прокинуты тунели IPV4-O-IPV4)

    В центральном офисе два интернет канала с гарантией 60Мбит, в филиалах по 8Мбит с гарантией (но в филиалах и нагрузка меньше, там работает по 10 человек).

    В центральном офисе поднят Exchange 2010 и есть кластер CASов из двух виртуалок, кластер юникастовый.
    Так вот, в двух городах почта через Outlook работает корректно, а в двух пользователи отваливаются от кластера с течением времени.

    Т.е. если я перезагружаю ноды кластера, неделю в этих городах все нормально, а через неделю начинают постепенно терять связь с сервером клиенты Outlook.
    Потеря связи выглядит так, пользователь замечает, что долго нет почты, перезапускает аутлук, и после перезапуска видит пустые папки почтового ящика. При этом в трее аутлук выводит сообщения поочередно "Попытка подключения к имя_кластера" и "Соединение с сервером Exchange восстановлено" и так бесконечно.
    Также перестает работать Outlook Anywhere по внутреннему имени кластера. Доступна только по внешнему опубликованному адресу.

    Если в файле hosts прописать следующиее ИМЯ_КЛАСТЕРА = ip адрес одного из нодов, то снова все будет работать около недели-двух, потом такой же отвал, меняем запись на ip адрес другого нода и снова живем недельку. Вот такая фигня, что делать и куда рыть так и не понял.

    Если снова все два нода перезагрузит, ситуация исправиться примерно на неделю-две.

    В центральном офисе стоит Exchange 2010 sp3 со всеми роллапами. Логи чистые, rpcping проходит без ошибок.
    Пробовал на нодах перезапускать все службы связанные с Exchange это тоже не спасает.
    28 декабря 2014 г. 8:19

Ответы

Все ответы

  • Если два филиала работают без проблем, а два других испытывают проблемы, то вопрос в чём различие между ними? в сетевых подключениях? маршрутизации? сетевом оборудовании?

    Сазонов Илья http://isazonov.wordpress.com/

    28 декабря 2014 г. 15:50
    Модератор
  • Сетевое оборудование одно и тоже, разные только провайдеры. Настройки оборудования сверял, все идентично настроено (ну кроме адресов естественно)
    • Изменено semenovskn 28 декабря 2014 г. 20:33
    28 декабря 2014 г. 20:32
  • Различие ищите между работающим и не работающим. Кроме вас никто это не сделает, т.к. не видит ни схемы включения, ни настроек оборудования, ни версий ПО.

    Сазонов Илья http://isazonov.wordpress.com/

    29 декабря 2014 г. 5:22
    Модератор
  • А вы попробуйте на время заменить WinNLB на внешнее решение балансировки, тем более на месяц его дают погонять многие вендоры (имеется ввиду решение для виртуальных сред, не "железные" балансировщики). Потому как WinNLB в unicast mode в среде ESX еще та "штучка", или у вас HyperV?

    Do not multiply entities beyond what is necessary

    29 декабря 2014 г. 6:26
  • Используем HyperV, хотя были мысли заменить WinNLB на что-то другое.

    В том то и дело, что различий между рабочим и не рабочим нет, все уже много лет у нас в конторе делается по одному стандарту на одном и том же оборудовании.

    29 декабря 2014 г. 8:52
  • Во время проявления проблемы соединение устанавливается с сервером? В логах IIS есть записи? Или netstat показывает SYN_SENT?

    Сазонов Илья http://isazonov.wordpress.com/

    29 декабря 2014 г. 9:16
    Модератор
  • Визуально такое впечатление, что соединение устанавливается и тут же разрывается, в трее появляются уведомления о том, что "соединение установлено" и тут же появляются песочные часы с уведомлением "Соединение восстановлено". В логах IIS запись о соединении есть с кодом ответа 200.

    В данный момент нет возможности проверить netstat'ом, позже выложу инфу.

    • Изменено semenovskn 29 декабря 2014 г. 10:54
    29 декабря 2014 г. 10:53
  • Иищите отличия от других филиалов: почтовые ящики в перемешку или по филиалам?


    Сазонов Илья http://isazonov.wordpress.com/

    29 декабря 2014 г. 12:38
    Модератор
  • Ящики в перемешку.

    Сейчас пробил сокеты нетстатом, вижу следующее:

    1. Для начала удалил почтовый профиль из аутлука

    2. При повторной настройке профиля, аутлук в момент поиска параметров сервера долго думает. Нетстат показывает следующее, есть коннект с CAS-кластером - ESTABLISHED, и далее SYN_SENT https к местным DC, сперва долбит DC1, потом переключается на DC2, а потом и вовсе прыгает на DC в других городах. После того как прошелся по всем DC, устанавливает соединение со своим местным DC1, и появляется коннект к одному из MXов.

    3. В этот момент всплывает окно с уведомлением, что нет подключения к Exchange Server, и предложение ввести имя сервера(замечу что в поле имя сервера вписано не имя кластера CAS а имя одного из MXов) и учетной записи вручную. После ручного ввода данных жму "Проверить имя" и моментально подхватываются настройки, аутлук рапортует, что все ОК, начинаю загрузку локальной копии почтового ящика.

    4. Быстро пробегает строка загрузки и передо мной аутлук с пустыми папками. Тут начинают из трея появляться сообщения о потери\восстановлении соединения с сервером. Нетстат в этот момент показывает, что есть соединение с CASами и MXами. Но висит все тот же перебор SYN_SENT по https к разным DC. Если вырубить аутлук, то попытки подключения по https к DC исчезают.

    На этом все заканчивается.

    29 декабря 2014 г. 13:39
  • Отличий реально нет (или я их пока не заметил, или существуют только те о которых писал выше).

    При этом если я попробую настроить почту проблемного пользователя в рабочем филиале, она создается без проблем, и я вижу профиле задвоенные, а то и затроенные папки (RSS-каналы, Черновики, Нежелательная почта) это значит, что какие-то манипуляции в проблемном филиале аутлук все таки выполнил.

    Уточню - CASы и MXы есть только в центральном офисе.

    29 декабря 2014 г. 13:44
  • К DCs он у вас ломится, потому что не настроен autodiscover - проверьте и настройте.

    Сазонов Илья http://isazonov.wordpress.com/

    29 декабря 2014 г. 16:52
    Модератор
  • autodiscover настроен и работает корректно.

    Кажется приблизился к источнику проблемы, если перезапустить службу на CASах "Служба балансировки нагрузки RPC\HTTP" (RPCHTTPLBS) то все начинает работать. Понять бы теперь что в ней сбоит и почему.

    29 декабря 2014 г. 17:32
  • Вы сами пишите про SYN_SENT при обащении к домен-контроллерам - это попытки найти Https://domain/autodiscover - покажите настройки autodiscover.

    Что касается основной проблемы, то опишите как у вас настроены сайты в AD. С ними всё нормально? Сети прописаны по сайтам корректно?


    Сазонов Илья http://isazonov.wordpress.com/

    30 декабря 2014 г. 8:09
    Модератор
  • Думаю, что если бы проблемы были с автообнаружением, то ни outlook ни мобильные устройства не смогли бы автоматически подхватывать настройки почты. А с этим проблем нет.

    Сайты настроены следующим образом:

    Каждый офис в отдельном сайте, с отдельной сетью(1 офис = 1 сеть), центральный с маской 22 бита, филиалы 24 бита. DC филиалов реплицируют данные только с центральным офисом, друг-друга филиалы не видят. В каждом городе по 2 DC. Связь дрежиться на IPV4-o-IPV4 туннеле, с настроенными маршрутами в сети, т.е. получается, что центр видит всех, а филиалы только центр.



    UPD: Для туннелей используются маршрутизаторы HP
    • Изменено semenovskn 30 декабря 2014 г. 8:51
    30 декабря 2014 г. 8:48
  • Т.е. SYN_SENT ко всем домен-контроллерам это вы считаете нормально?


    Сазонов Илья http://isazonov.wordpress.com/

    30 декабря 2014 г. 11:34
    Модератор
  • Мне кажется это происходит из-за того, что сбой службы балансировки приводит к тому, что кластер перестает по какой-то причине обрабатывать запросы клиента, и тут начинается поиск иных путей на других DC.

    Ведь после перезапуска службы SYN_SENT не наблюдается.

    Проверка "Test E-mail AutoConfiguration" в Outlook проходит без проблем и отображает нужные параметры. Все таки дело в MS NLB (или в юникастовом кластере MS NLB) мне кажется.
    • Изменено semenovskn 30 декабря 2014 г. 12:21
    30 декабря 2014 г. 11:49
  • Чтобы не ходить бесконечно кругами, рекомендую:

    1. Исправить настройки autodiscovery

    2. Проверить настройки сайтов в AD и привязки к сайтам в Exchange

    Что-то более точное сказать без знания деталей невозможно.


    Сазонов Илья http://isazonov.wordpress.com/

    30 декабря 2014 г. 12:43
    Модератор
  • ОК, Илья посоветуйте, если не трудно, статьи на которые стоит опираться при работе над пунктами 1 и 2.
    30 декабря 2014 г. 13:54
  • В общем проблему победил следующим образом - просто установил все доступные обновления из центра обновлений, и похоже дело было конкретно в нехватке этого пакета http://www.microsoft.com/ru-ru/download/details.aspx?id=35875

    Устанавливал на виртуалки с cas и хостовые железки.


    28 января 2015 г. 8:35