none
Вопрос по exchange RRS feed

  • Вопрос

  • Здравствуйте! Помогите прояснить такую ситуацию.

    22.04.2013 произошел инцидент, связанный с загрузкой всех серверов (3 сервера, Win 2008 R2) контроллеров домена (загрузка процессоров до 100%). 

    Выяснилось, что загрузку процессоров осуществляет процесс диспетчера учетных записей  (Lsass.exe).В результате дальнейшего анализа выяснилось наличие трафика от серверов корпоративной почтовой системы. Выявлены проблемы в работе программы Microsoft Outlook с общими папками корпоративной почтовой системы - общие папки не отображались в Microsoft Outlook, хотя в OWA общие папки были доступны.

    В результате проведенных мероприятий  (перезагрузка серверов с ролями «сервера почтовых ящиков») возможность работы Microsoft Outlook с общими папками была восстановлена. При этом произошло снижение загрузки процессоров серверов контроллеров домена,  и возврат ее в нормальный режим.

    В логах на CAS серверах было обнаружено

    2013-04-22T21:00:49.692Z,8540,455,/O=SNOS/OU=MAIL/cn=Recipients/cn=user1,,OUTLOOK.EXE,11.0.8161.0,Classic,,,ncacn_ip_tcp,,,1144 (rop::WrongServer),00:00:00,"Redirected: not a user's home public server, suggested new server: /o=SNOS/ou=Exchange Administrative Group (FYDIBOHF23SPDLT)/cn=Configuration/cn=Servers/cn=MBX2",RopHandler: Logon: 
    2013-04-22T21:00:56.057Z,7200,2131,/O=SNOS/OU=MAIL/cn=Recipients/cn=user2,,UcMapi.exe,14.0.6109.5000,Classic,,,ncacn_ip_tcp,,,1144 (rop::WrongServer),00:00:00.0467997,"Redirected: not a user's home public server, suggested new server: /o=SNOS/ou=Exchange Administrative Group (FYDIBOHF23SPDLT)/cn=Configuration/cn=Servers/cn=MBX1",RopHandler: Logon: 
    2013-04-22T21:01:14.824Z,8188,219,/O=SNOS/OU=MAIL/cn=Recipients/cn=user3,,OUTLOOK.EXE,14.0.6131.5002,Cached,,,ncacn_ip_tcp,,,1144 (rop::WrongServer),00:00:00,"Redirected: alternate server requested, suggested new server: /o=SNOS/ou=Exchange Administrative Group (FYDIBOHF23SPDLT)/cn=Configuration/cn=Servers/cn=MBX1",RopHandler: Logon: 

    Версия MS Exchange 14.03.0123.003

    Хронология событий:

    1. Произведена диагностика и проверка целостности базы данных AD, проведение проверки работ дменных служб. Проблем не обнаружено
    2. Произведено сравнение с соответствующим трафиком для другого домена. Особых различий не выявлено
    3. Произведен анализ сетевого трафика процесса диспетчера учетных записей домена. Анализ показал наличие трафика от серверов корпоративной почтовой системы, но каких либо особенностей не выявил
    4. Общее снижение нагрузки было связано с наступлением нерабочего времени и резкого уменьшения количества пользователей, работающих в сети
    5. В логах RPC соединений выявлены частичные отказы.
    6. Выявлены проблемы в работе Outlook с общими папками корпоративной почтовой системы
    7. принято решение о перезагрузке почтовых серверов баз данных. Работоспособность общих папок восстановилась после перезагрузки обоих серверов. В логах RPC соединений почтовых серверов количество записей с ошибками уменьшилось. Общая производительность серверов контроллеров домена находилась в пределах нормы


    30 апреля 2013 г. 12:38

Ответы

Все ответы

  • Привет,

    Не слишком понятно, в чем именно заключается Ваш вопрос.

    LSASS создает процесс, ответственный за проверку подлинности пользователей для службы Winlogon.

    Модератор
  • Именно так!

    Вопрос заключается в том, почему произошла такая нагрузка на контроллеры?

    После перезагрузки MBX-серверов нагрузка на контроллерах домена упала, а доступ к общим папкам восстановился. По логам видно, что пользователи долбились и получали разворот.

    http://support.microsoft.com/kb/2535105/ru - здесь есть описание проблемы, но там решается накатом ролапа на сп1. Но дело в том, что проблема возникла на MS Exchange 14.03.0123.003. 

  • Вы написали о наличии ошибок в логах RPC. Какие ошибки там были ? 

    Модератор
  • 2013-04-22T21:00:49.692Z,8540,455,/O=SNOS/OU=MAIL/cn=Recipients/cn=user1,,OUTLOOK.EXE,11.0.8161.0,Classic,,,ncacn_ip_tcp,,,1144 (rop::WrongServer),00:00:00,"Redirected: not a user's home public server, suggested new server: /o=SNOS/ou=Exchange Administrative Group (FYDIBOHF23SPDLT)/cn=Configuration/cn=Servers/cn=MBX2",RopHandler: Logon: 
    2013-04-22T21:01:14.824Z,8188,219,/O=SNOS/OU=MAIL/cn=Recipients/cn=user3,,OUTLOOK.EXE,14.0.6131.5002,Cached,,,ncacn_ip_tcp,,,1144 (rop::WrongServer),00:00:00,"Redirected: alternate server requested, suggested new server: /o=SNOS/ou=Exchange Administrative Group (FYDIBOHF23SPDLT)/cn=Configuration/cn=Servers/cn=MBX1",RopHandler: Logon: 

    Весь лог более чем на 90% состоял из этих записей. На сегодняшний день такие записи попадаются, но их число несущественно


  • Советую Вам , если опят произойдет нагрузка, с помощью Resource Monitor'a посмотреть на все процессы загружающие сервер
    Модератор
  • В топе на контроллерах домена был процесс Lsass.exe, на exchange-серверах нагрузка была нормальная. Каких-то иных странных процессов на серверах не было

  • Посмотрите обсуждение про Lsass.exe :

    lsass.exe using 20% - 25% of CPU non-stop

    Модератор
  • Коллеги, всем доброго дня! В дополнении к этой теме, есть некоторая ссылка на KB support.microsoft.com/kb/2535105/ru

    Но там применительно к сервис паку 1.

    Ниже есть такое:

    Самостоятельное решение проблемы
    Чтобы самостоятельно отключить службу доступности после установки обновления, выполните указанные ниже действия.
    1.В меню Пуск выберите пункт Выполнить, в поле Открыть: введите команду regedit и нажмите кнопку ОК.
    2.Найдите и щелкните следующий подраздел реестра:
    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\MSExchangeRPC\
    3.В меню Правка выберите пункт Создать, а затем — Раздел.
    4.Введите ParametersSystem и нажмите клавишу ВВОД.
    5.Найдите и щелкните следующий подраздел реестра:
    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\MSExchangeRPC\ParametersSystem
    6.В меню Правка выберите пункт Создать, а затем — Параметр DWORD.
    7.Введите DisableAvailabilityServiceCalls и нажмите клавишу ВВОД.
    8.В области сведений щелкните правой кнопкой мыши параметр DisableAvailabilityServiceCalls и выберите пункт Изменить.
    9.В поле Значение введите 1 и нажмите кнопку ОК.
    10.Закройте редактор реестра.

    Актуальный ли этот параметр для SP3?