none
Проблема с переносом ящиков с Exchange 2010 на 2013 RRS feed

  • Вопрос

  • Коллеги, привет.

    Помогите разобраться с проблемой.

    Имеется Exchange 2010 SP3 RU11 в DAG и Exchange 2013 CU11 в DAG.

    На текущий момент происходит миграция ящиков на 2013.

    Иногда при миграции происходит странные вещи (где-то один из десяти ящиков) и запрос на перемещение становится Relinquish. При этом почтовая база, в которую перемещается этот ящик вываливается с ошибками в журнале событий и переезжает на другой сервер. Этот почтовый ящик оказывается в карантине, который удаляется потом оттуда через реестр.

    Ошибки при этом в логе следующие:

    MSExchangeIS 1002:

    Unhandled exception (System.Threading.LockRecursionException: Recursive read lock acquisitions not allowed in this mode.
       at System.Threading.ReaderWriterLockSlim.TryEnterReadLockCore(TimeoutTracker timeout)
       at System.Threading.ReaderWriterLockSlim.TryEnterReadLock(TimeoutTracker timeout)
       at Microsoft.Exchange.Server.Storage.Common.LockManager.NamedLockObject.TryGetLock(LockType lockType, TimeSpan timeout, ILockStatistics lockStats)
       at Microsoft.Exchange.Server.Storage.Common.LockManager.GetNamedLockImpl(NamedLockObject lockObject, LockType lockType, TimeSpan timeout, ILockStatistics lockStats)
       at Microsoft.Exchange.Server.Storage.Common.LockManager.TryGetLock(ILockName lockName, LockType lockType, TimeSpan timeout, ILockStatistics lockStats)
       at Microsoft.Exchange.Server.Storage.StoreCommonServices.Context.TryLockMailboxForOperation(MailboxState mailboxState, Boolean sharedLock, TimeSpan timeout)
       at Microsoft.Exchange.Server.Storage.StoreCommonServices.Context.StartMailboxOperation(MailboxCreation mailboxCreation, Boolean findRemovedMailbox, Boolean skipQuarantineCheck, Boolean takeDababaseConnectionOwnership)

    MSExchangeIS 1013

    The mailbox with mailboxguid "b85741c8-e89d-49d9-9ea5-f6f3d7eff56b" caused crash or resource outage on database (GUID="345dde76-4830-4610-b4c9-88198b9e9ed5"). Description: LockRecursionException: ST.ReaderWriterLockSlim.TryEnterReadLockCore,ST.ReaderWriterLockSlim.TryEnterReadLock,MESSCLM.NamedLockObject.TryGetLock,MESSC.LockManager.GetNamedLockImpl,MESSC.LockManager.TryGetLock,MESSSCS.Context.TryLockMailboxForOperation,MESSSCS.Context.StartMailbox.

    MSExchange Mailbox Replication 1114

    The Microsoft Exchange Mailbox Replication service was unable to save changes to request.
    Request: 'b85741c8-e89d-49d9-9ea5-f6f3d7eff56b' (836b7950-3d48-4088-9b74-ea540712d5fd)
    Database: TestDB1
    Error: MapiExceptionMdbOffline: Unable to make connection to the server. (hr=0x80004005, ec=1142)
    Diagnostic context:
        Lid: 41192   dwParam: 0x1
        Lid: 49384  
        Lid: 51176   StoreEc: 0x476     
        Lid: 48104  
        Lid: 39912   StoreEc: 0x476     
        Lid: 41192   dwParam: 0x2
        Lid: 49384  
        Lid: 51176   StoreEc: 0x476     
        Lid: 48104  
        Lid: 39912   StoreEc: 0x476     
        Lid: 41192   dwParam: 0x0
        Lid: 49064   dwParam: 0x1
        Lid: 38439   EMSMDBPOOL.EcPoolConnect called [length=48]
        Lid: 54823   EMSMDBPOOL.EcPoolConnect returned [ec=0x476][length=20][latency=0]

    ExchangeStoreDB 126

    At '09.02.2016 3:07:00' the Exchange store database 'TestDB1' copy on this server encountered an error that caused the database to be dismounted. For more detail about the failure, consult the Event log on the server for other "ExchangeStoreDb" or "msexchangerepl" events. A successful failover restored service.

    При этом если удалить почтовый ящик из карантина и попробовать еще раз его перенести, иногда он перемещается и никаких проблем не происходит.

    Штатно система работает без проблем.

    9 февраля 2016 г. 8:07

Ответы

  • Крах процессов Exchange обычно связан с нехваткой ресурсов, в первую очередь оперативной памяти и дисковой производительности. 16 Гб ОЗУ не так мало (у меня восемьсот ящиков живет на 12 Гб, и проблем по этой части нет), но если это накладывается на медленную дисковую подсистему, то может случиться все, что угодно.

    Resource Monitor что показывает по части времени отклика дисковой системы и длины очередей на томах сервера?


    Evgeniy Lotosh // MCSE: Server infrastructure, MCSE: Messaging

    10 февраля 2016 г. 10:44

Все ответы

  • Надо проверить, нет ли проблем с производительностью дисков на серверах Exchange 2013. Попробуйте запустить миграцию и понаблюдать за очередью дисковых операций. Так же проверьте, как изменяется очередь копирования и воспроизведения для баз:

    Get-MailboxDatabase TestDB1 | Get-MailboxDatabaseCopyStatus

    Каким образом подключены диски к серверам Exchange 2013, на которых расположена база TestDB1?

    9 февраля 2016 г. 8:19
  • Еще вопрос. Сколько RAM на серверах Exchange 2013?
    9 февраля 2016 г. 8:20
  • Забыл добавить, exchange находится на двух виртуальных машинах на кластере hyper-v на Windows Server 2012 R2. По ресурсам 8 vcpu, 16 gb ram. Количество ящиков - 300.
    9 февраля 2016 г. 8:47
  • А в этих логах "ExchangeStoreDb" or "msexchangerepl" events что пишется?

    Похоже на проблему с производительностью.

    16 гб оперативки на 300 ящиков не очень то и много.

    9 февраля 2016 г. 8:56
  • Пару часов назад опять отвалилась база.

    msexchangerepl (6444) An attempt to open the file "G:\Databases\TestDB2\TestDB2.edb" for read only access failed with system error 32 (0x00000020): "The process cannot access the file because it is being used by another process. ".  The open file operation will fail with error -1032 (0xfffffbf8). 

    The indexing of mailbox database TestDB2 encountered an unexpected exception. Error details: Microsoft.Exchange.Search.Core.Abstraction.OperationFailedException: The component operation has failed. ---> Microsoft.Exchange.Search.Core.Abstraction.OperationFailedException: The component operation has failed. ---> Microsoft.Exchange.Search.Core.Abstraction.ComponentFailedPermanentException: An exception occurred processing MDB: 52424753-4133-4136-b7b4-d8b0f25d4aff. ---> Microsoft.Exchange.Search.Core.Abstraction.ComponentFailedPermanentException: Failed to read notifications, MDB: 52424753-4133-4136-b7b4-d8b0f25d4aff. ---> Microsoft.Mapi.MapiExceptionMdbOffline: MapiExceptionMdbOffline: Unable to read events. (hr=0x80004005, ec=1142)
    Diagnostic context:
        Lid: 44776  
        Lid: 12514   Win32Error: 0x6BA
        Lid: 62184  
        Lid: 16280   dwParam: 0x0 Msg: EEInfo: ComputerName: n/a
        Lid: 8600    dwParam: 0x0 Msg: EEInfo: ProcessID: 5236
        Lid: 12696   dwParam: 0x0 Msg: EEInfo: Generation Time: 0416-02-09T12:45:44.3120000Z
        Lid: 10648   dwParam: 0x0 Msg: EEInfo: Generating component: 2
        Lid: 14744   dwParam: 0x0 Msg: EEInfo: Status: 1722
        Lid: 9624    dwParam: 0x0 Msg: EEInfo: Detection location: 10
        Lid: 13720   dwParam: 0x0 Msg: EEInfo: Flags: 0
        Lid: 11672   dwParam: 0x0 Msg: EEInfo: NumberOfParameters: 2
        Lid: 12952   dwParam: 0x0 Msg: EEInfo: prm[0]: Long val: 3221225524
        Lid: 8856    dwParam: 0x0 Msg: EEInfo: prm[1]: Unicode  string: \RPC Control\LRPC-cfdaf963ac40e67630

    9 февраля 2016 г. 14:50
  • Отвалилась после этой ошибки:

    Watson report about to be sent for process id: 8128, with parameters: E12, c-RTL-AMD64, 15.00.1156.006, M.E.Store.Worker, unknown, M.E.S.S.C.L.NamedLockObject.TryGetLock, S.Threading.LockRecursionException, b062, unknown.
    ErrorReportingEnabled: False 

    9 февраля 2016 г. 14:52

  • msexchangerepl (6444) An attempt to open the file "G:\Databases\TestDB2\TestDB2.edb" for read only access failed with system error 32 (0x00000020): "The process cannot access the file because it is being used by another process. ".  The open file operation will fail with error -1032 (0xfffffbf8). 

    антивируса случаем нет? исключения на нем корректно настроены, если он есть?
    9 февраля 2016 г. 15:10
  • Антивируса на сервере нет...
    9 февраля 2016 г. 17:18
  • Крах процессов Exchange обычно связан с нехваткой ресурсов, в первую очередь оперативной памяти и дисковой производительности. 16 Гб ОЗУ не так мало (у меня восемьсот ящиков живет на 12 Гб, и проблем по этой части нет), но если это накладывается на медленную дисковую подсистему, то может случиться все, что угодно.

    Resource Monitor что показывает по части времени отклика дисковой системы и длины очередей на томах сервера?


    Evgeniy Lotosh // MCSE: Server infrastructure, MCSE: Messaging

    10 февраля 2016 г. 10:44
  • Добавил 8 Gb памяти на каждый сервер, 2 дня пока без сбоев.

    Буду наблюдать дальше.

    10 февраля 2016 г. 20:48
  • Журналы транзакций у вас в каком режиме? Если не включено циклическое заполнение, то при переносе почтовых ящиков очень быстро заканчивается место на разделе, где они размещаются. И еще, желательно, чтобы дисковый раздел именно под эти журналы был достаточно быстрым.

    Do not multiply entities beyond what is necessary

    11 февраля 2016 г. 4:36
  • Хорошо, если как предполагали проблема только в ram. Однако могут быть и диски, поэтому, Артем уже спрашивал, но вы не ответили про диск G:

    "Каким образом подключены диски к серверам Exchange 2013, на которых расположена база TestDB1?"

    11 февраля 2016 г. 6:45