Лучший отвечающий
Отваливается подключение к Exchange 2010

Вопрос
-
Есть центральный офис с доменом, есть филиалы в 4х городах, все офисы находятся в одном домене. Сеть между ними объединена роутерами (прокинуты тунели IPV4-O-IPV4)
В центральном офисе два интернет канала с гарантией 60Мбит, в филиалах по 8Мбит с гарантией (но в филиалах и нагрузка меньше, там работает по 10 человек).
В центральном офисе поднят Exchange 2010 и есть кластер CASов из двух виртуалок, кластер юникастовый.
Так вот, в двух городах почта через Outlook работает корректно, а в двух пользователи отваливаются от кластера с течением времени.
Т.е. если я перезагружаю ноды кластера, неделю в этих городах все нормально, а через неделю начинают постепенно терять связь с сервером клиенты Outlook.
Потеря связи выглядит так, пользователь замечает, что долго нет почты, перезапускает аутлук, и после перезапуска видит пустые папки почтового ящика. При этом в трее аутлук выводит сообщения поочередно "Попытка подключения к имя_кластера" и "Соединение с сервером Exchange восстановлено" и так бесконечно.
Также перестает работать Outlook Anywhere по внутреннему имени кластера. Доступна только по внешнему опубликованному адресу.
Если в файле hosts прописать следующиее ИМЯ_КЛАСТЕРА = ip адрес одного из нодов, то снова все будет работать около недели-двух, потом такой же отвал, меняем запись на ip адрес другого нода и снова живем недельку. Вот такая фигня, что делать и куда рыть так и не понял.
Если снова все два нода перезагрузит, ситуация исправиться примерно на неделю-две.
В центральном офисе стоит Exchange 2010 sp3 со всеми роллапами. Логи чистые, rpcping проходит без ошибок.
Пробовал на нодах перезапускать все службы связанные с Exchange это тоже не спасает.28 декабря 2014 г. 8:19
Ответы
-
В общем проблему победил следующим образом - просто установил все доступные обновления из центра обновлений, и похоже дело было конкретно в нехватке этого пакета http://www.microsoft.com/ru-ru/download/details.aspx?id=35875
Устанавливал на виртуалки с cas и хостовые железки.
- Изменено semenovskn 28 января 2015 г. 8:36
- Предложено в качестве ответа ILYA [ sie ] SazonovModerator 28 января 2015 г. 8:43
- Помечено в качестве ответа ILYA [ sie ] SazonovModerator 28 января 2015 г. 8:43
- Изменено ILYA [ sie ] SazonovModerator 28 января 2015 г. 8:44 Поправил ссылку
28 января 2015 г. 8:35
Все ответы
-
Если два филиала работают без проблем, а два других испытывают проблемы, то вопрос в чём различие между ними? в сетевых подключениях? маршрутизации? сетевом оборудовании?
Сазонов Илья http://isazonov.wordpress.com/
28 декабря 2014 г. 15:50Модератор -
Сетевое оборудование одно и тоже, разные только провайдеры. Настройки оборудования сверял, все идентично настроено (ну кроме адресов естественно)
- Изменено semenovskn 28 декабря 2014 г. 20:33
28 декабря 2014 г. 20:32 -
Различие ищите между работающим и не работающим. Кроме вас никто это не сделает, т.к. не видит ни схемы включения, ни настроек оборудования, ни версий ПО.
Сазонов Илья http://isazonov.wordpress.com/
29 декабря 2014 г. 5:22Модератор -
А вы попробуйте на время заменить WinNLB на внешнее решение балансировки, тем более на месяц его дают погонять многие вендоры (имеется ввиду решение для виртуальных сред, не "железные" балансировщики). Потому как WinNLB в unicast mode в среде ESX еще та "штучка", или у вас HyperV?
Do not multiply entities beyond what is necessary
29 декабря 2014 г. 6:26 -
Используем HyperV, хотя были мысли заменить WinNLB на что-то другое.
В том то и дело, что различий между рабочим и не рабочим нет, все уже много лет у нас в конторе делается по одному стандарту на одном и том же оборудовании.
29 декабря 2014 г. 8:52 -
Во время проявления проблемы соединение устанавливается с сервером? В логах IIS есть записи? Или netstat показывает SYN_SENT?
Сазонов Илья http://isazonov.wordpress.com/
29 декабря 2014 г. 9:16Модератор -
Визуально такое впечатление, что соединение устанавливается и тут же разрывается, в трее появляются уведомления о том, что "соединение установлено" и тут же появляются песочные часы с уведомлением "Соединение восстановлено". В логах IIS запись о соединении есть с кодом ответа 200.
В данный момент нет возможности проверить netstat'ом, позже выложу инфу.
- Изменено semenovskn 29 декабря 2014 г. 10:54
29 декабря 2014 г. 10:53 -
Иищите отличия от других филиалов: почтовые ящики в перемешку или по филиалам?
Сазонов Илья http://isazonov.wordpress.com/
29 декабря 2014 г. 12:38Модератор -
Ящики в перемешку.
Сейчас пробил сокеты нетстатом, вижу следующее:
1. Для начала удалил почтовый профиль из аутлука
2. При повторной настройке профиля, аутлук в момент поиска параметров сервера долго думает. Нетстат показывает следующее, есть коннект с CAS-кластером - ESTABLISHED, и далее SYN_SENT https к местным DC, сперва долбит DC1, потом переключается на DC2, а потом и вовсе прыгает на DC в других городах. После того как прошелся по всем DC, устанавливает соединение со своим местным DC1, и появляется коннект к одному из MXов.
3. В этот момент всплывает окно с уведомлением, что нет подключения к Exchange Server, и предложение ввести имя сервера(замечу что в поле имя сервера вписано не имя кластера CAS а имя одного из MXов) и учетной записи вручную. После ручного ввода данных жму "Проверить имя" и моментально подхватываются настройки, аутлук рапортует, что все ОК, начинаю загрузку локальной копии почтового ящика.
4. Быстро пробегает строка загрузки и передо мной аутлук с пустыми папками. Тут начинают из трея появляться сообщения о потери\восстановлении соединения с сервером. Нетстат в этот момент показывает, что есть соединение с CASами и MXами. Но висит все тот же перебор SYN_SENT по https к разным DC. Если вырубить аутлук, то попытки подключения по https к DC исчезают.
На этом все заканчивается.
29 декабря 2014 г. 13:39 -
Отличий реально нет (или я их пока не заметил, или существуют только те о которых писал выше).
При этом если я попробую настроить почту проблемного пользователя в рабочем филиале, она создается без проблем, и я вижу профиле задвоенные, а то и затроенные папки (RSS-каналы, Черновики, Нежелательная почта) это значит, что какие-то манипуляции в проблемном филиале аутлук все таки выполнил.
Уточню - CASы и MXы есть только в центральном офисе.
29 декабря 2014 г. 13:44 -
К DCs он у вас ломится, потому что не настроен autodiscover - проверьте и настройте.
Сазонов Илья http://isazonov.wordpress.com/
29 декабря 2014 г. 16:52Модератор -
autodiscover настроен и работает корректно.
Кажется приблизился к источнику проблемы, если перезапустить службу на CASах "Служба балансировки нагрузки RPC\HTTP" (RPCHTTPLBS) то все начинает работать. Понять бы теперь что в ней сбоит и почему.
29 декабря 2014 г. 17:32 -
Вы сами пишите про SYN_SENT при обащении к домен-контроллерам - это попытки найти Https://domain/autodiscover - покажите настройки autodiscover.
Что касается основной проблемы, то опишите как у вас настроены сайты в AD. С ними всё нормально? Сети прописаны по сайтам корректно?
Сазонов Илья http://isazonov.wordpress.com/
30 декабря 2014 г. 8:09Модератор -
Думаю, что если бы проблемы были с автообнаружением, то ни outlook ни мобильные устройства не смогли бы автоматически подхватывать настройки почты. А с этим проблем нет.
Сайты настроены следующим образом:
Каждый офис в отдельном сайте, с отдельной сетью(1 офис = 1 сеть), центральный с маской 22 бита, филиалы 24 бита. DC филиалов реплицируют данные только с центральным офисом, друг-друга филиалы не видят. В каждом городе по 2 DC. Связь дрежиться на IPV4-o-IPV4 туннеле, с настроенными маршрутами в сети, т.е. получается, что центр видит всех, а филиалы только центр.
UPD: Для туннелей используются маршрутизаторы HP- Изменено semenovskn 30 декабря 2014 г. 8:51
30 декабря 2014 г. 8:48 -
Т.е. SYN_SENT ко всем домен-контроллерам это вы считаете нормально?
Сазонов Илья http://isazonov.wordpress.com/
30 декабря 2014 г. 11:34Модератор -
Мне кажется это происходит из-за того, что сбой службы балансировки приводит к тому, что кластер перестает по какой-то причине обрабатывать запросы клиента, и тут начинается поиск иных путей на других DC.
Ведь после перезапуска службы SYN_SENT не наблюдается.
Проверка "Test E-mail AutoConfiguration" в Outlook проходит без проблем и отображает нужные параметры. Все таки дело в MS NLB (или в юникастовом кластере MS NLB) мне кажется.- Изменено semenovskn 30 декабря 2014 г. 12:21
30 декабря 2014 г. 11:49 -
Чтобы не ходить бесконечно кругами, рекомендую:
1. Исправить настройки autodiscovery
2. Проверить настройки сайтов в AD и привязки к сайтам в Exchange
Что-то более точное сказать без знания деталей невозможно.
Сазонов Илья http://isazonov.wordpress.com/
30 декабря 2014 г. 12:43Модератор -
ОК, Илья посоветуйте, если не трудно, статьи на которые стоит опираться при работе над пунктами 1 и 2.30 декабря 2014 г. 13:54
-
В общем проблему победил следующим образом - просто установил все доступные обновления из центра обновлений, и похоже дело было конкретно в нехватке этого пакета http://www.microsoft.com/ru-ru/download/details.aspx?id=35875
Устанавливал на виртуалки с cas и хостовые железки.
- Изменено semenovskn 28 января 2015 г. 8:36
- Предложено в качестве ответа ILYA [ sie ] SazonovModerator 28 января 2015 г. 8:43
- Помечено в качестве ответа ILYA [ sie ] SazonovModerator 28 января 2015 г. 8:43
- Изменено ILYA [ sie ] SazonovModerator 28 января 2015 г. 8:44 Поправил ссылку
28 января 2015 г. 8:35