none
Задержки доставки писем RRS feed

  • Вопрос

  • Добрый день!

    Периодически, 1-2 раза в сутки, перестают приходить письма. После 15-60 минут приходят все разом или приходится перезапускать MSExchangeTransport, после чего тоже все письма приходят, как с улицы так и внутренние. Очередь в этот момент пуста. MessageTrackingLog выдает список писем eventid - SUBMITDEFER. С чем может быть связано подобное поведение?
    12 апреля 2016 г. 9:25

Ответы

  • На всякий случай добавлю, что ошибка "4.3.1 Insufficient system resources" как раз показывает на срабатывание механизма замедленной обратной реакции. 

    Посмотрите дополнительно тут:

    http://exchangeserverpro.com/exchange-transport-server-back-pressure/

    Очень подробно описано, как искать сответствующие события (15004 - 15007). Смотреть надо на всех серверах с ролью MBX.

    Чаще всего я сталкивался с такой проблемой, когда данные из памяти не успевали записываться на диск и Exchange приостанавливал получение писем. Вылечить можно правкой файла EdgeTransport.exe.config (это безопасно и всегда можно откатить назад):

    <add key="DatabaseCheckPointDepthMax" value="896MB" /> 
    <add key="DatabaseMaxCacheSize" value="1536MB" />
    
    Изменения необходимо применить на всех серверах и перезагрузить службы Microsoft Exchange Information Store и Microsoft Exchange Transport. 

    27 апреля 2016 г. 11:13
  • Ну вот вам и причина: 4.3.1 Insufficient system resources

    Проверяйте нагрузку на сервер. ЦПУ, оперативную память, свободное место на диске, очереди на чтение/запись диска и т.д.

    Add: если вам помогает перезапуск транспорта, скорее всего проблема с дисками или с местом на диске, где очередь находится.

    27 апреля 2016 г. 10:13

Все ответы

  • Добрый день,

    а с параметром |fl вывод покажите там где SUBMITDEFER?

    12 апреля 2016 г. 9:44
  • Еще проверьте в момент сбоя длину очереди копирования и воспроизведения базы данных:

    Get-MailboxDatabaseCopyStatus *

    Что происходит, если в момент сбоя отправить почту через telnet?

    telnet host 25
    EHLO hostname
    MAIL FROM: <test@test.ru>
    RCPT TO: <recipient@test.ru>
    DATA
    SUBJECT: test
    
    Test
    
    .

    Как вы проверяете очередь? Попробуйте так:

    Get-TransportService | Get-Queue | ft Identity,DeliveryType,MessageCount -AutoSize

    Ну и статус компонентов:

    Get-ExchangeServer | Get-ServerComponentState | ?{$_.State -ne "Active"} | ft -AutoSize

    И в любом случае должно быть что-то в логах. Возможно, срабатывает механизм Back Pressure:

    https://technet.microsoft.com/en-us/library/bb201658%28v=exchg.160%29.aspx?f=255&MSPPError=-2147217396

    http://msexchangeguru.com/2013/07/29/troubleshooting-backpressure/

    12 апреля 2016 г. 9:46
  • Проверьте, что достаточно свободного места на диске с очередями и базами данных.

    scientia potentia est
    My blog

    12 апреля 2016 г. 9:52
  • и так с каждым письмом в интервалом 5 сек

    • Изменено eremeev15 12 апреля 2016 г. 11:41
    12 апреля 2016 г. 11:40
  • Вы все что выше вам написали проверили? И где вывод одного из этих логов с |fl?
    12 апреля 2016 г. 12:25
  • Иван, вот с |fl

    все что выше не проделал... о сбое узнаю от разгневанных пользователей и спешу скорее восстановить работу перезагрузкой транспорта


    26 апреля 2016 г. 12:00
  • "о сбое узнаю от разгневанных пользователей и спешу скорее восстановить работу перезагрузкой транспорта"

    Отличный повод познакомиться с Zabbix/Icinga/SCOM :)

    А постфактум всегда можно проверить логи. Если был сбой, то обязательно что-то найдете. Я вам давал ссылку, где можно почитать про механизм замедленной обратной реакции. Начните с этого.

    26 апреля 2016 г. 12:15
  • Иван, вот с |fl

    Нет, это вы опять что то не то показываете. Давайте так, для проблемного письма:

    Get-MessageTrackingLog -Sender user@sender.ru -Recipients user@recipient.ru | fl

    26 апреля 2016 г. 14:28
  • Привет.

    Если известно, что перезапуск сервиса помогает получить письма, а в логах ничего нету.

    То как следующий шаг это повысить уровень логирования (средний уровань) для этого сервиса на один - два дня. До следующего сбоя.

    Set-EventLogLevel 


    MCITP, MCSE. Regards, Oleg

    26 апреля 2016 г. 17:08
    Модератор
  • Вот конкретное письмо


    27 апреля 2016 г. 10:09
  • Артем, спасибо! 
    Да, очень крепко задумываюсь про мониторинг. И про замедленную обработку очень подходит по поведению. Пытаюсь понять причины.
    27 апреля 2016 г. 10:12
  • Ну вот вам и причина: 4.3.1 Insufficient system resources

    Проверяйте нагрузку на сервер. ЦПУ, оперативную память, свободное место на диске, очереди на чтение/запись диска и т.д.

    Add: если вам помогает перезапуск транспорта, скорее всего проблема с дисками или с местом на диске, где очередь находится.

    27 апреля 2016 г. 10:13
  • Олег, проблема в том, что в логах скорее всего всё есть, но я не знаю что именно и в каком логе искать =)
    27 апреля 2016 г. 10:18
  • На всякий случай добавлю, что ошибка "4.3.1 Insufficient system resources" как раз показывает на срабатывание механизма замедленной обратной реакции. 

    Посмотрите дополнительно тут:

    http://exchangeserverpro.com/exchange-transport-server-back-pressure/

    Очень подробно описано, как искать сответствующие события (15004 - 15007). Смотреть надо на всех серверах с ролью MBX.

    Чаще всего я сталкивался с такой проблемой, когда данные из памяти не успевали записываться на диск и Exchange приостанавливал получение писем. Вылечить можно правкой файла EdgeTransport.exe.config (это безопасно и всегда можно откатить назад):

    <add key="DatabaseCheckPointDepthMax" value="896MB" /> 
    <add key="DatabaseMaxCacheSize" value="1536MB" />
    
    Изменения необходимо применить на всех серверах и перезагрузить службы Microsoft Exchange Information Store и Microsoft Exchange Transport. 

    27 апреля 2016 г. 11:13