none
Exchange 2003 после восстановления Acronis True Image Echo Enterprise with Universal Restore RRS feed

  • Вопрос

  • Всем привет!
    Несколько дней назад у сервера DELL (на котором был развернут Exchange 2003 Enterprise SP2 и проработал 1.5 года) сгорела материнская плата. Бакапы ежедневно снимались с помощью Acronis True Image Echo Enterprise Server на NAS. Мы заказали такую же новую материнскую плату у своих поставщиков и они её нам доставят только через месяц. Пока её доставят пройдет куча времени и нужно было срочно восстанавливать из бакапа Exchange. Запасных серверов не оказалось под рукой а время неумолимо идет. Решили временно использовать один свободный комп за которым редко кто сидел и восстановить на нем Exchange с помощью Acronis Universal Restore. Операция прошла успешно - Exchange снова заработал. Установил дрова под сетевую карту и материнскую плату. Проверил целостность баз хранилища с помощью isinteg и eseutil - все нормально, ничего подозрительного. Проверяю посылку/прием тестовых писем юзерам - до одних доходит, до других нет. Причем от тех кому не доходит не возвращаются письма с ошибкой доставки - такое ощущение что они ушли в их ящик но их там нету! А если от них послать письмо то оно успешно доходит до любого пользователя. У этих юзеров в Аутлуке я пробовал удалить и заново подключить учетную запись "Microsoft Exhange" - не помогло.
    Я еще раз проверил базу хранилища с помощью утилит isinteg и eseutil - Все в норме. Проверил даже диск на ошибки - ни одного сбойного сектора и нет ошибок файловой системы. Может это из-за того что на компе 1 ГБ оперативки ? На неисправном сервере было 4 ГБ а в Boot.ini я выставлял ключи /3GB /USERVA=3030. Но на компе я убрал эти ключи.
    Не могу стоять когда другие работают, пойду полежу...
    • Перемещено Tina_Tian 18 марта 2012 г. 8:13 forum merge (От:Exchange Server 2003/2000/5.5)
    29 октября 2009 г. 7:20

Ответы

  • Совсем забыл про этот вопрос, невежливо как-то ))))  Должен отписаться.

    Давно все исправил (2 ноября 2009 г) . Нужно было просто удалить почтовые ящики пользователей к которым не доходила почта, очистить (purge), затем заново создать и подцепить пользователям. За письма (хранившиеся на только что потертых мейлбоксах) беспокоится не стоит, они никуда не пропадут потому что хранятся у юзеров в аутлуках  и тут же продублируются на сервер во время синхронизации. После удаления (очищения) и пересоздания этих мейлбоксов - все стало работать на ура!


    Не могу стоять когда другие работают, пойду полежу...
    • Помечено в качестве ответа RAIDerMan 18 ноября 2010 г. 20:10
    18 ноября 2010 г. 20:09

Все ответы

  • 1. сколько хранилищ
    2. их дизайн
    3. есть ли что то общее в тех кому "не доходит"
    4. что в логах

    для чистоты эксперимента сделайте нового пользователя отправьте письмо от него существующим и другим новым пользователям.


    blog.wadmin.ru
    29 октября 2009 г. 8:36
  • 1. Одно хранилище Mailbox Store и одно Public Folder Store
    2. Что имеется ввиду под фразой "дизайн хранилищ"? Насколько я знаю, термин "дизайн хранилищ" означает дизайн серверов Exchange с кластеризацией (например CCR) и хранилищем SAN или DAS. Если я вас правильно понял то отвечаю: дизайн такой - кластеризации нет, Эксчендж и его хранилище находились на сервере и его жестких дисках SAS в массиве RAID 1. (было так пока мамка не полетела, а сейчас временно все это дело распологается на простом компе)
    3. Не нашел ничего общего и схожего у тех кому "не доходят" письма, все хаотично получилось.
    4. Какие логи должны в данном случае интересовать, те что находятся в папке: Program Files\Exchsrvr\MAIL.log или же которые в папке: \WINDOWS\system32\LogFiles\W3SVC1 ?

    Создал нового пользователя TEST - письма отлично доходят и уходят!
     
    Не могу стоять когда другие работают, пойду полежу...
    29 октября 2009 г. 11:15
  • 1. принято
    2. имеется ввиду логи и базы разделены или находятся на одном диске
    3. что из методов испробовано? POP3 IMAP OWA RPC?
    4. системный applicationlog

    кстати вы кэширование у клиентов отключали?

    blog.wadmin.ru
    29 октября 2009 г. 11:39
  • 2. Логи и базы находятся на одном диске
    3. Испробован OWA - там та же картина что и в Аутлуках
    4. В системном логе ничего плохого, в логе File Replication Service обнаружил ругань NtFrs на новый жесткий диск и что он отказывается реплицировать, но я исправил эту проблему с помощью параметра в реестре "Enable Journal Wrap Automatic Restore" = 1. В Application логе была ругань AD и Эксченджа на тот момент когда только поднял ОС и Эксчендж из бакапа потому что на компе другая сетевая карта а система не находила драйвер, в итоге AD и Эксчендж ругались на то что не виден PDC и DNS. А сейчас в Application логе никакой ругани и только два Warning:

    Event Type:	Warning
    Event Source:	MSDTC
    Event Category:	SVC
    Event ID:	53258
    Date:		30.10.2009
    Time:		10:16:02
    User:		N/A
    Computer:	MAIL
    Description:
    MS DTC could not correctly process a DC Promotion/Demotion event.
    MS DTC will continue to function and will use the existing security settings.
    Error Specifics: d:\nt\com\complus\dtc\dtc\adme\uiname.cpp:9351, Pid: 1300 No Callstack, CmdLine: C:\WINDOWS\system32\msdtc.exe Event Type: Warning Event Source: MSDTC Event Category: SVC Event ID: 53258 Date: 30.10.2009 Time: 10:16:02 User: N/A Computer: MAIL Description: MS DTC could not correctly process a DC Promotion/Demotion event.
    MS DTC will continue to function and will use the existing security settings.
    Error Specifics: %1


    В корне диска C: я заметил лог - MegaRaid.log - открыл а там ругань DELL SAS Raid Manager на отсутствие RAID адаптера и дисков SAS.
    Его а также драйвера от скоропостижно скончавшегося сервера (Broadcom NetXtreme Adapter вместе с утилитой агреггации каналов, ATI VGA, И утилиты Dell оп управлению и мониторингу сервера) пришлось деинсталировать.

    Кэширование отключал - не помогает.
    Не могу стоять когда другие работают, пойду полежу...
    30 октября 2009 г. 6:38
  • И что странно - сегодня пришли письма-уведомления от postmaster c темой: Delivery Status Notification (Delay) с содержанием:

    This is an automatically generated Delivery Status Notification.
    
    THIS IS A WARNING MESSAGE ONLY.
    
    YOU DO NOT NEED TO RESEND YOUR MESSAGE.
    
    Delivery to the following recipients has been delayed.
    
           user@firma.com


    Reporting-MTA: dns;mail.firma.com
    
    Received-From-MTA: dns;mail.firma.com Arrival-Date: Thu, 29 Oct 2009 18:10:11 +0400 Final-Recipient: rfc822;user@firma.com Action: delayed Status: 4.4.7 Will-Retry-Until: Sat, 31 Oct 2009 18:10:12 +0300 X-Display-Name: user

    Это уведомления о том что письма доставлены именно тем кому не доходило. А от тех кому доходило никаких уведомлений не пришло.
    Странно то что - Никогда таких уведомлений не приходило.
    Не могу стоять когда другие работают, пойду полежу...
    30 октября 2009 г. 8:44
  • Кто у вас формирует такой красивый NDR?
    может имеет смысл посмотреть на него..?
    blog.wadmin.ru
    30 октября 2009 г. 9:38
  • Эти NDR сформировал MS Exchange.
    В Queues в Local delivery висят 80 писем которые адресованы тем кому не доходят.
    Может повысить уровень диагностики на MSExchangeTransport на все события?
    Что можно предпринять в первую очередь? Может отцепить и заново подцепить юзерам их мейлбоксы?


    Не могу стоять когда другие работают, пойду полежу...
    30 октября 2009 г. 12:36
  • занятно.
    если переподцепление поможет то я буду удивлен, но попробовать стоит.

    поднимайте уровень логирования и пишите что найдете "неправильного".

    предварительно
    1. для новых пользователей почта ходит нормально
    2. для старых ничего не приходит.

    от старых к новым почта доходит?
    blog.wadmin.ru
    30 октября 2009 г. 12:44
  • Щас буду пробовать переподцепление.

    от старых к новым почта отлично идет, а обратно уже нет (висит в В Queues в Local delivery)

    Так что предварительно:
    1. для новых пользователей почта приходит и уходит нормально
    2. для старых ничего не приходит но уходит отлично!


    Не могу стоять когда другие работают, пойду полежу...
    30 октября 2009 г. 12:51
  • Переподключение ящиков не дало никакого эффекта, так что не удивляйтесь!
    Зато выловил первую ошибку MSExchangeTransport:

    Event Type:	Error
    Event Source:	MSExchangeTransport
    Event Category:	SMTP Protocol 
    Event ID:	7010
    Date:		30.10.2009
    Time:		17:49:13
    User:		N/A
    Computer:	MAIL
    Description:
    This is an SMTP protocol log for virtual server ID 1, connection #1.
    The client at "xxx.xxx.xxx.xxx" sent a "xexch50" command,
    and the SMTP server responded with "504 Need to authenticate first ".
    The full command sent was "xexch50 2020 2".
    This will probably cause the connection to fail.

    Не могу стоять когда другие работают, пойду полежу...
    30 октября 2009 г. 14:56
  • думаю начать стоит с этого - http://support.microsoft.com/kb/815372
    далее - http://support.microsoft.com/?id=843106

    blog.wadmin.ru
    30 октября 2009 г. 15:08
  • По поводу ошибки MSExchangeTransport, она появляется всякий раз как кто-то
    пытается послать письма тем юзерам которым они "не доходят".

    Теперь по поводу того что вы мне посоветовали:
    1. http://support.microsoft.com/kb/815372
    Ставил обратно ключ /3GB /USERVA=3030 - не помогло.
    Убирал его и ставил в реестре значение DWORD 0xFFFFFFFF для параметра SystemPages. Не помогло.
    Выставлял даже 303000 - тоже не помогло. Заметил что сервис Store.exe стал занимать в памяти 16МБ, после перезапуска начинает плавно занимать память с 11МБ и доходит до 25МБ

    2. http://support.microsoft.com/?id=843106
    Убедился, что флажок Встроенная проверка подлинности установлен.
    Но MSExchangeTransport по прежнему ругается как только посылаешь письма юзерам до которых письма не доходят.


    Не могу стоять когда другие работают, пойду полежу...
    31 октября 2009 г. 7:04
  • при 1 г оперативки ставить ключи /3GB /USERVA нельзя (статья была про оптимизацию использования памяти)


    предлагаю несколько путей решения
    1. 1 гб явно маловато (посмотрите на значения счетчиков памяти скорее всего nonpaged pool будет на пределе) расширьте память хотя бы до 2 гб
    2. далее проверяем следующее (в вашем случае это один сервер)
    Если встроенная проверка подлинности Windows включена, но события продолжают появляться, то, возможно, отправляющий сервер (в событии 7004 или 7010) не имеет или ему отказано в праве SendAs на принимающем сервере. Если эти события наблюдаются и на отправляющем, и на принимающем сервере, то, возможно, у них нет права SendAs в отношении друг друга. Право SendAs не назначается явно. Как правило, оно наследуется через членство в группе Exchange Domain Servers (EDS). Если группа EDS не имеет запрещающей записи управления доступом (Access Control Entry, ACE), то, возможно, сервер, на котором возникает проблема, входит в другую группу, которая имеет запрещающую запись ACE, или группа EDS входит в другую группу, которая имеет запрещающую запись ACE. Для успешного выполнения команда XEXCH50 должна иметь право SendAs для серверов в организации Exchange.

    это вы проверяли?

    в вашем случае думаю проблема с отправкой состоит в том что клиенты которые пытаются отправить письмо не могут пройти проверку (в security логе от этого должны быть следы, естественно нужно включить аудит), если это так то копать следует уже саму ОСь потому что Exchange отходит на второй план

    кстати.
    Exchange BPA запускали?

    PS ситуация мягко выражаясь занятная.
    я изначально не использую акронис ни для чего исторически... и в данном случае просто бы сделал бы восстановление http://technet.microsoft.com/en-us/library/bb125070%28EXCHG.65%29.aspx благо это делалаось не один раз и методики прописаны очень давно.
    blog.wadmin.ru
    31 октября 2009 г. 7:37
  • В security логе нет следов - все проходят проверку успешно!

    Запустил Exchange BPA вот что он мне показал:

    1. SystemPages set too high
    The 'SystemPages' value is set too high on server mail.kenan.az and may cause instability. Current value: 1107296255.
    (интересно какое значение нужно выставить для SystemPages при 1ГБ физической памяти и отсутствие ключей /3GB /USERVA=3030?)

    2. Database backup critical
    Database 'Mailbox Store (MAIL)' on server MAIL contains 123 mailboxes. This database has never had a full online backup.

    3. Database backup critical
    Database 'Public Folder Store (MAIL)' on server MAIL has never had a full online backup.

    По поводу 2 и 3 - вранье! Позавчера сделал онлайн бакап чтобы подрезать логи транзакции.


    Не могу стоять когда другие работают, пойду полежу...
    31 октября 2009 г. 10:17
  • по п.1 сюда - http://technet.microsoft.com/ru-ru/library/aa996786.aspx
    ключей ставить не надо.
    заодно зайдите сюда - http://blogs.technet.com/yongrhee/archive/2009/08/10/how-to-troubleshoot-low-system-page-table-entries-system-pte-s.aspx

    по всем признакам причина использования памяти косые драйверы, возможно видеокарты.

    память добавили? (если клиенты ходят через RPC over https то надо смотреть за настройками IISa, можно его временно отключить и посмотреть на результат)
    blog.wadmin.ru
    31 октября 2009 г. 12:34
  • Память не добавил - ибо нету лишнего модуля памятии и никто на это денег не выделит.
    Деньги ушли на заказ нового сервера + на заказ мамки для старого.

    По пунткту 1.  Установил значение параметра SystemPages в 0, ключи убрал.
    Сделал повторный онлайн бакап  - Exchange BPA  не ругается. Но есть несколько Warning

    По поводу косых драйверов видеокарты - я вообще драйвер на видюху не ставил - а старый оставшийся от скончавшегося сервера я удалил

    Клиенты не ходят через RPC over HTTPS

    В понедельник буду тракировать письма через Exchange TRA.
    Не могу стоять когда другие работают, пойду полежу...
    31 октября 2009 г. 13:08
  • PTE изменилось?
    Посмотрите за деятельностью IIS-а
    судя по всему у вас сходная ситуация с недавним случаем - ex2003 был в явно перегруженном состоянии (3500 пользователей которые ходили через RPC over HTTPS) и естественно сервер помирал дважды в день и стабильно в понедельник
    1. утром когда все приходили на работу
    2. перед окончанием рабочего дня (видимо народ решал что надо хоть чем то заниматься)
    3. в понедельник когда все смотрели почту за выходные

    помогло довольно жесткое ограничение для IIS-а по скорости и пришлось делать recycle пулу приложения каждые 10 минут в часы пик.

    далее решилось разнесением ролей и добавлением памяти до 4 гигов.

    PS если у вас все это хозяйство стоит на рабочей станции то думаю можно найти хотя бы временно еще один модуль памяти...

    blog.wadmin.ru
    31 октября 2009 г. 13:27
  • Незнаю какой должен быть PTE для нормальной работы Exchnage на компе с 1 ГБ Памяти
    Приведу показания счетчика Perfmon.msc:


    \\MAIL
    Memory
     Available MBytes			619
     Free System Page Table Entries	225681
     Pages/sec			1,000
     Pool Nonpaged Allocs		81958
     Pool Nonpaged Bytes		21385216
     Pool Paged Allocs			50949
     Pool Paged Bytes			27693056
     Pool Paged Resident Bytes		26791936
    
    MSExchangelS
     VM Largest Block Size		789381120
     VM Total 16MB Free Blocks		13
     VM Total Free Blocks		177
     VM Total Large Free Block Bytes     1511510016
    
    MSExchangeIS Mailbox		_Total
     Active Client Logons		4
     Client Logons			54
     Logon Operations/sec		0,000
     Messages Sent			4
     Messages Sent/min			0
     Peak Client Logons		61
    
    PhysicalDisk			_Total
     Avg. Disk Queue Length		0,099
    
    Process				_Total
     Virtual Bytes 			4985913344
     Virtual Bytes Peak		5138776064
    
    Processor				_Total
     % Processor Time			0,000

    Сегодня попробую найти и поставить дополнительный 1ГБ памяти.
    Не могу стоять когда другие работают, пойду полежу...
    2 ноября 2009 г. 7:38
  • с памятью все в норме (в момент снимка... но стоит поставить счетчик с шагом в 5 секунд и понаблюдать что с памятью будет при моделировании проблемы)
    Exbpa ошибки больше не дает?

    при раскопке своих записей нашел почти похожий случай.
    необходимо проверить корректность работы DNS (delayed выдается из-за того что сервер считает недоступным сервер получателя)
    попробуйте стукнуться telnet-ом на 25 порт.
    после поднятия уровня логирования нужно проверить логи
    blog.wadmin.ru
    2 ноября 2009 г. 8:19
  • Совсем забыл про этот вопрос, невежливо как-то ))))  Должен отписаться.

    Давно все исправил (2 ноября 2009 г) . Нужно было просто удалить почтовые ящики пользователей к которым не доходила почта, очистить (purge), затем заново создать и подцепить пользователям. За письма (хранившиеся на только что потертых мейлбоксах) беспокоится не стоит, они никуда не пропадут потому что хранятся у юзеров в аутлуках  и тут же продублируются на сервер во время синхронизации. После удаления (очищения) и пересоздания этих мейлбоксов - все стало работать на ура!


    Не могу стоять когда другие работают, пойду полежу...
    • Помечено в качестве ответа RAIDerMan 18 ноября 2010 г. 20:10
    18 ноября 2010 г. 20:09