none
Store.exe опять падает :( RRS feed

  • Вопрос

  • Что-то понедельник начинается весело, начало темы тут:

    http://forums.microsoft.com/TechNet-RU/ShowPost.aspx?PostID=3579746&SiteID=40

     

    Вчера Information Store даже 2 раза упал, 1 раз в утром, 2й вечером, из новых событий нашел вот это:

     

    Source:MSExchange Common

    Event ID: 4999

    Watson report about to be sent to dw20.exe for process id: 4504, with parameters: E12, c-RTL-AMD64, 08.01.0278.000, MSExchangeMailSubmission, M.E.Assistants, M.E.A.DatabaseManager.RemoveAllOnlineDatabases, System.InvalidProgramException, df54, 08.01.0278.000. ErrorReportingEnabled: False

     

    Самое интересное: M.E.A.DatabaseManager.RemoveAllOnlineDatabases - именно после этого Information Store отключается.

     

    По предположению о дефрагментации баз:

    Было предположение о том, что именно дефрагментации 40гб базы вызывает проблемы.

    В прошлый раз перестроил график дефрагментации, вчера, база в 40Гб не дефрагментировалась, но Information Store падала 2 раза. Т.ч. дефрагментацию базы можно исключить, остальные базы имеют размер от 2.5 до 23Гб.

     

    Вот и думаю я, что-же это такое может быть? Читаю логи, думаю...

     

     

     

    • Перемещено Hengzhe Li 18 марта 2012 г. 5:36 forum merge (От:Exchange Server 2007)
    14 июля 2008 г. 3:52

Все ответы

  •  

    Уровень диагностики на MSExchange Common и MSExchangeMailSubmission какой ?
    14 июля 2008 г. 12:26
  • Как я уже писал, перекиньте ящики в новую базу, а базу удалите.
    14 июля 2008 г. 12:53
    Модератор
  •  Sergey Krylov написано:

     

    Уровень диагностики на MSExchange Common и MSExchangeMailSubmission какой ?

     

    По умолчанию, спасибо за идею, увеличу.

    15 июля 2008 г. 7:20
  • Можно попробовать, но в чем может быть причина, ведь база создавалась с нуля и обслуживания в день падения не проводилось.

     

    Мне и самому хочется разделить этого монтра на 2 по 20Гб, уж больно здоровый store получился.

     

    Спасибо за советы, с завтрашнего дня я в отпуске Smile на 2 недели буду отстутствовать, т.ч о результатах позже отпишу.

    15 июля 2008 г. 7:23
  •  Sergey Babkov написано:

    Можно попробовать, но в чем может быть причина,

     

    вы eseutil & isinteg погоняйте (не дефрагментацию) - а тесты с фикасацией\исправлением ошибок

    15 июля 2008 г. 11:04
  • И опять 25, всех с понедельником.

     

    Ситуация повторяется, вновь Information Store упала, но на этот раз благодоря (спасибо) расширенной диагностике нашлось что-то интересное:

     

    Событие зафиксированно какраз до момента падения:

    Source:MSExchangeIS Mailbox

    Category:General

    ID:7200

    Background thread FDoMaintenance halted on database "E1-2048\E1-2048" due to error code 0xffffff99.

    Именно в это время система мониторинга фиксирует резкое высвобождение доступной памяти: с 1,5Гб до 11,2 Гб. Что на 97% свидетельствует о падении службы Information Store

     

     

    После этого события история событий повторяется:

    MSExchangeTransport

    Inbound authentication failed with error OutOfMemory for Receive connector Default E1. The authentication mechanism is Gssapi. The source IP address of the client who tried to authenticate to Microsoft Exchange is

     

    MSExchangeMonitoring

    Execution of 'Test-Mailflow -ErrorLatency:60 -MonitoringContextEmbarrassedtrue' failed, detailed information:

    The cmdlet failed to run. Error: System.Threading.ThreadStartException: Thread failed to start. ---> System.OutOfMemoryException: Exception of type 'System.OutOfMemoryException' was thrown.

     

    MSExchange Common

    Watson report about to be sent to dw20.exe for process id: 2528, with parameters: E12, c-RTL-AMD64, 08.01.0278.000, MSExchangeMailSubmission, M.E.Assistants, M.E.A.Base.CatchMeIfYouCan, System.OutOfMemoryException, 47e, 08.01.0278.000. ErrorReportingEnabled: False

     

    Мне кажется после долгих поисков наконец нашлась истина, вопрос что делать:

    В данной группе всего-то 3 человека, просто перемещу их скриптом в нове хранилище ночью а старую базу удалю.

     

    Вопрос к разработчикам:

    Разве они не подумали, что ошибки в одной базе должны приводить к ее падению, а не к падению всего сервера, в 2003 такого небыло.

     

    Что скажете?

    4 августа 2008 г. 5:25
  • вы б прошлись все же isinteg'ом - с фиксацией ошибок

     

    5 августа 2008 г. 10:46
  •  

    Пройдусь неперменно, только дождусь технологического перерыва, ибо в процессе работы пользователей как-то не очень хочется. (вдруг опять все упадет  )

     

     

    5 августа 2008 г. 11:08
  • И всех с понедельником!

     

    Вчера опять упала служба Information Store, на этот раз база совершенно другая, и ошибка выглядит так:

    Source: MSExchange Assistants

    ID:9002

    An error occurred on database "32Mb\32Mb".

    Function name or description of problem: SLINK::EcTestMessage

    Error: 0x3f0

     

    После этого сообщения начинается дефрагментация следующей базы, ч/з минуту она прерывается и ВСЕ базы отключаются вот с такими событиями:

     

    Source: Assistants

    ID: 9002

    Service MSExchangeMailSubmission. Stopped processing database Exchange/Ex1-хххх (bfgdshtd6-ssfsg-sfg345e-85348-3563763483681ee).

     

    А далее слудует хорошо знакомое событие:

     

    A transient failure has occurred. The problem may resolve itself in awhile. The service will retry in 56 seconds. Diagnostic information:

     

    Что касается базы в посте выше (2048), провел диагностику и дефрагментацию - все отлично, ошибок и проблем нет, прошло уже порядка месяца. Причем, базы живут на разных физических массивах, анналогичное оборудование работает под SQL базами как пол года, тоже без проблем.

     

    Эта база конечно в размере большая, я разделю ее на 2 части, но все равно, даже если есть проблема с 1й базой, то необязательно выключать все.

     

    Что-то явно не то с логикой и надежностью.

    8 сентября 2008 г. 3:18
  • так вы isinteg c фиксацией запускали ?

     

    8 сентября 2008 г. 11:46
  • В прошлый раз, забыл написать, полностью проверил базу, eseutil и isinteg но ошибок так и не обнаружил.

     

    В этот раз упала совершенно другая база с другой ошибкой, в выходные попробую   проверить и ее.

     

    Только зачем ронять все остальные базы?

     

    Можно ли  указать isinteg базу принудительно, без ручного выбора, чтобы по шедулеру задание отработало?

    9 сентября 2008 г. 6:23