none
Exchange Server 2010, SMTP sporadisch nicht erreichbar RRS feed

  • Frage

  • Hallo,

     

    auf einem anderen Exchangeserver (2010, SP1, Version 14.1 Build 218.15) gehen merkwürdige Dinge vor ;) Am Wochenende, urplötzlich, war der SMTP Dienst nicht mehr erreichbar. Wir prüfen den SMTP Port dieses Servers regelmäßig mit Nagios.

    Per SMTPExplorer und Telnet war der Service auch nicht zu erreichen, egal ob von ausserhalb oder auf der Maschine selber (z.B. telnet localhost 25).

    In der Ereignissanzeige geht dem erstmaligen Auftreten des Problems folgendes voraus:

     

    Protokollname: Application
    Quelle:  MSExchangeTransport
    Datum:   10.10.2010 14:19:19
    Ereignis-ID: 16022
    Aufgabenkategorie:Konfiguration
    Ebene:   Informationen
    Schlüsselwörter:Klassisch
    Benutzer:  Nicht zutreffend
    Computer:  mx1.DOMAIN.local
    Beschreibung:
    Konfigurationsupdate für 'Microsoft.Exchange.Transport.AcceptedDomainTable' erfolgreich abgeschlossen.
    Ereignis-XML:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
     <System>
     <Provider Name="MSExchangeTransport" />
     <EventID Qualifiers="16388">16022</EventID>
     <Level>4</Level>
     <Task>16</Task>
     <Keywords>0x80000000000000</Keywords>
     <TimeCreated SystemTime="2010-10-10T12:19:19.000Z" />
     <EventRecordID>118534</EventRecordID>
     <Channel>Application</Channel>
     <Computer>mx1.DOMAIN.local</Computer>
     <Security />
     </System>
     <EventData>
     <Data>Microsoft.Exchange.Transport.AcceptedDomainTable</Data>
     </EventData>
    </Event>

    Danach wurde es richtig lustig:

     

    Protokollname: Application
    Quelle:  MSExchangeTransport
    Datum:   10.10.2010 14:19:22
    Ereignis-ID: 10003
    Aufgabenkategorie:PoisonMessage
    Ebene:   Fehler
    Schlüsselwörter:Klassisch
    Benutzer:  Nicht zutreffend
    Computer:  mx1.DOMAIN.local
    Beschreibung:
    Fehler des Transportprozesses während der Nachrichtenverarbeitung mit dem folgenden Aufrufstapel: System.FormatException: Der Text für die Antwort darf nur US-ASCII-Zeichen enthalten.
     bei Microsoft.Exchange.Data.Transport.Smtp.SmtpResponse..ctor(String statusCode, String enhancedStatusCode, String[] statusText)
     bei Microsoft.Exchange.Transport.Categorizer.CategorizerComponent.HandleComponentException(Exception e, TaskContext taskContext)
     bei Microsoft.Exchange.Transport.Categorizer.TaskContext.Invoke()
     bei Microsoft.Exchange.Transport.Categorizer.CatScheduler.JobThreadEntry(Object ignored)
     bei System.Threading.ExecutionContext.Run(ExecutionContext executionContext, ContextCallback callback, Object state)
     bei System.Threading._ThreadPoolWaitCallback.PerformWaitCallbackInternal(_ThreadPoolWaitCallback tpWaitCallBack)
     bei System.Threading._ThreadPoolWaitCallback.PerformWaitCallback(Object state).
    Ereignis-XML:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
     <System>
     <Provider Name="MSExchangeTransport" />
     <EventID Qualifiers="49156">10003</EventID>
     <Level>2</Level>
     <Task>10</Task>
     <Keywords>0x80000000000000</Keywords>
     <TimeCreated SystemTime="2010-10-10T12:19:22.000Z" />
     <EventRecordID>118547</EventRecordID>
     <Channel>Application</Channel>
     <Computer>mx1.DOMAIN.local</Computer>
     <Security />
     </System>
     <EventData>
     <Data>System.FormatException: Der Text für die Antwort darf nur US-ASCII-Zeichen enthalten.
     bei Microsoft.Exchange.Data.Transport.Smtp.SmtpResponse..ctor(String statusCode, String enhancedStatusCode, String[] statusText)
     bei Microsoft.Exchange.Transport.Categorizer.CategorizerComponent.HandleComponentException(Exception e, TaskContext taskContext)
     bei Microsoft.Exchange.Transport.Categorizer.TaskContext.Invoke()
     bei Microsoft.Exchange.Transport.Categorizer.CatScheduler.JobThreadEntry(Object ignored)
     bei System.Threading.ExecutionContext.Run(ExecutionContext executionContext, ContextCallback callback, Object state)
     bei System.Threading._ThreadPoolWaitCallback.PerformWaitCallbackInternal(_ThreadPoolWaitCallback tpWaitCallBack)
     bei System.Threading._ThreadPoolWaitCallback.PerformWaitCallback(Object state)</Data>
     </EventData>
    </Event>

     

    und:

     

    Protokollname: Application
    Quelle:  MSExchange Common
    Datum:   10.10.2010 14:19:22
    Ereignis-ID: 4999
    Aufgabenkategorie:Allgemein
    Ebene:   Fehler
    Schlüsselwörter:Klassisch
    Benutzer:  Nicht zutreffend
    Computer:  mx1.DOMAIN.local
    Beschreibung:
    Der Watson-Bericht steht kurz vor dem Versenden für die Prozess-ID: 8076, mit den Parametern: E12, c-RTL-AMD64, 14.01.0218.015, edgetransport, M.E.Data.Transport, M.E.D.T.S.SmtpResponse..ctor, System.FormatException, f7df, 14.01.0218.011.
    ErrorReportingEnabled: False
    Ereignis-XML:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
     <System>
     <Provider Name="MSExchange Common" />
     <EventID Qualifiers="16388">4999</EventID>
     <Level>2</Level>
     <Task>1</Task>
     <Keywords>0x80000000000000</Keywords>
     <TimeCreated SystemTime="2010-10-10T12:19:22.000Z" />
     <EventRecordID>118549</EventRecordID>
     <Channel>Application</Channel>
     <Computer>mx1.DOMAIN.local</Computer>
     <Security />
     </System>
     <EventData>
     <Data>8076</Data>
     <Data>E12</Data>
     <Data>c-RTL-AMD64</Data>
     <Data>14.01.0218.015</Data>
     <Data>edgetransport</Data>
     <Data>M.E.Data.Transport</Data>
     <Data>M.E.D.T.S.SmtpResponse..ctor</Data>
     <Data>System.FormatException</Data>
     <Data>f7df</Data>
     <Data>14.01.0218.011</Data>
     <Data>False</Data>
     <Data>
     </Data>
     </EventData>
    </Event>

     

    Danach ziemlich Probleme mit dem E-Mailversand und Empfang, wie gesagt SMTP Dienst war nicht erreibar. In der PoisonQueue tauchte eine Spammail auf. Am Anfang konnte ich diese gar nicht löschen weil das Snapin der Console sicht nicht mit dem Exchangeserver verbinden konnte usw. Inzwischen sind die Mails gelöscht, aber sie tauchen immer wieder auf.

    Der Zeit ist es so, dass ca. 1 mal pro Stunde der SMTP nicht erreichbar ist für ca. 7 Minuten (+/-). Begleitend dazu die hier zitierten Events 4999 und 10003, aber das auch nicht immer.

     

    Kann es sein, dass eine Spambombe o.ä. die Queue kaputt gemacht hat?

    Könnt ihr mir helfen das Problem einzgrenzen? Hab schon einiges durchgelesen im Technet und Sachen probiert, hat bisher nichts geholfen. Netzwerktreiber sind aktuell.

    Es hat auch den Anschein, dass der Transportdienst kaputt ist oder so.

    Folgende Threads konnten mich incht weiterbringen:

    http://www.eggheadcafe.com/software/aspnet/36005798/exchange-2010-transport-dienst-startet-nicht.aspx

    http://portal.msxforum.de/modules/newbb/viewtopic.php?viewmode=thread&topic_id=12080&forum=34&post_id=68797

    Der Zeit ist in Vorbereitung, dass ein weitere Server die Hubtransportrolle vom jetzigen Server übernimmt, dauert aber noch und hilft mir nur bedingt, die Ursache zu finden und somit eine zukünftige Vermeidung des Problems zu erreichen.

     

    Danke und Gruß

    Dienstag, 12. Oktober 2010 12:58

Antworten

  • Also, er scheint sich jetzt wieder gefangen zu haben. Seit über einer Woche läuft er stabil. Die Nachrichten in der Posisonqueue sind auch nicht mehr aufgetaucht.

     

    Aber kann das sein, dass Nachrichten in der Poisonqueue einen Exchangeserver lahmlegen können? Frei nach dem Motto: It's not a bug, it's a feature...

    • Als Antwort markiert weeeman Donnerstag, 21. Oktober 2010 11:22
    Donnerstag, 21. Oktober 2010 11:22

Alle Antworten

  • Hi weeeman,
     
    hast du mal AV deinstalliert oder zu mindestens angehalten? Vieleicht wurde
    eine neue Engine eingespielt, die zu Problemen führt?
     
    Wurde der Server mal neu gestartet und hat sich irgendetwas am Server sonst
    nocht geändert?
     
    Viele Grüße
    Christian
     
    Dienstag, 12. Oktober 2010 13:52
    Moderator
  • Meinst du mit AV den Virenschutz? (Nur um kein Kommunikationsverständnis aufkommen zu lassen). AV wäre in dem Fall nicht aktiv.

    Server wurde, nach dem das Problem auftrat, mehrmals neu gestartet. In den Tagen zu vor wurde nichts relevantes geändert

    Dienstag, 12. Oktober 2010 14:00
  • Hi weeeman,
     
    > Meinst du mit AV den Virenschutz? (Nur um kein Kommunikationsverständnis
    > aufkommen zu lassen). AV wäre in dem Fall nicht aktiv.
     
    Ja, meinte den Virenscanner....
     
    > Server wurde, nach dem das Problem auftrat, mehrmals neu gestartet. In den
    > Tagen zu vor wurde nichts relevantes geändert
     
    Was für Kleinigkeiten, die nicht relevant zu sein scheinen?
     
    Es gibt auch einige KB-Artikel, aber die sind für Exchange 2007 und werden
    durch das aktuellste RU gefixt:
    ...
     
    Habt ihr rollup1 für SP1 auch schon installiert? Wenn ja hilft wohl nur noch
    ein Call bei MS!
     
    Viele Grüße
    Christian
     
    Dienstag, 12. Oktober 2010 15:02
    Moderator
  • Moin,

    könntest Du mal die Ausgabe von "get-transportagent" posten? Dann sollten
    die nicht MS-Agenten deaktiviert werden, da meistens fremde Agente das
    Problem sind.


    Grüße aus Berlin schickt Robert
    MVP Exchange Server
    Dienstag, 12. Oktober 2010 17:21
  • Was für Kleinigkeiten, die nicht relevant zu sein scheinen?
    Desktop aufgeräumt war die Aktion unmittelbar davor, 2-3 Wochen vorher das SP1 installiert.
    Klingt zumindest für die Ursachenforschung spannend, weil es eine Spammail gibt, die scheinbar keinen korrekten Header hat....
    Habt ihr rollup1 für SP1 auch schon installiert? Wenn ja hilft wohl nur noch
    ein Call bei MS!
    Ja, haben wir. Ich schau mal, dass ich das nochmal drüber bügel. Call bei MS.... och nö ;)
    Mittwoch, 13. Oktober 2010 07:32
  • Moin,

    könntest Du mal die Ausgabe von "get-transportagent" posten? Dann sollten
    die nicht MS-Agenten deaktiviert werden, da meistens fremde Agente das
    Problem sind.


    Grüße aus Berlin schickt Robert
    MVP Exchange Server


    get-transportagent sagt:


    Identity                                           Enabled         Priority      
    --------                                           -------         --------      
    Transport Rule Agent                               True            1             
    Text Messaging Routing Agent                       True            2             
    Text Messaging Delivery Agent                      True            3             

    Mittwoch, 13. Oktober 2010 07:32
  • Hi weeeman,
     
    > > Habt ihr rollup1 für SP1 auch schon installiert? Wenn ja hilft wohl nur
    noch
    > > ein Call bei MS!
    >
    > Ja, haben wir. Ich schau mal, dass ich das nochmal drüber bügel. Call bei
    > MS.... och nö ;)
     
    Der Call tut nicht weh und wenn es ein Bug ist, ist er auch kostenlos...
     
    Viele Grüße
    Christian
     
    Mittwoch, 13. Oktober 2010 07:40
    Moderator
  • Am Wed, 13 Oct 2010 07:32:58 +0000 schrieb weeeman:

    Moin,

    könntest Du mal die Ausgabe von "get-transportagent" posten? Dann sollten
    die nicht MS-Agenten deaktiviert werden, da meistens fremde Agente das
    Problem sind.


    Grüße aus Berlin schickt Robert
    MVP Exchange Server

    get-transportagent sagt:

    ok, das ist nichts besonderes drin, nur die Exchange-eigenen Agenten. Ein
    fehlerhafter Agent kann damit als Ursache nahezu ausgeschlossen werden.


    Grüße aus Berlin schickt Robert
    MVP Exchange Server
    Mittwoch, 13. Oktober 2010 15:59
  • Also, aktueller Zwischenstand:

     

    Gestern hatten wir über viele Stunden einen total Ausfall, aber jetzt um 8:42 MESZ läuft er seit über 13 Stunden wieder korrekt. Keine Ahnung warum jetzt auf einmal... Das Ainzeige was ich gemacht hab war:

    Get-EventLogLevel MSExchangeTransport | Set-EventLogLevel -Level High

    Um mal etwas mehr Infos zu kriegen.... Seltsame Sache das...

     

    @Christian: Call bei Microsoft: Ich habe angerufen, die Frau hat mir gesagt, die Finanzabteilung würde sich innerhalb einer Stunde bei mir melden. Das war gestern um 16 Uhr. Um 17:50 Uhr ruf ich noch mal an und dann hieß es, die sind schon im Feierabend...

    Ich warte trotzdem noch ab, um zu sehen ob er über mehrere Tage stabil läuft

    Donnerstag, 14. Oktober 2010 06:47
  • Hi weeeman,

    @Christian: Call bei Microsoft: Ich habe angerufen, die Frau hat mir gesagt, die Finanzabteilung würde sich innerhalb einer Stunde bei mir melden. Das war gestern um 16 Uhr. Um 17:50 Uhr ruf ich noch mal an und dann hieß es, die sind schon im Feierabend...

    dann halte uns mal auf dem laufenden - bin gespannt, wie das weiter geht...
    Hoffe nur das niemand am Wochenende Probleme hat! ;-)

    Viele Grüße
    Christian

    Donnerstag, 14. Oktober 2010 07:16
    Moderator
  • Also, er scheint sich jetzt wieder gefangen zu haben. Seit über einer Woche läuft er stabil. Die Nachrichten in der Posisonqueue sind auch nicht mehr aufgetaucht.

     

    Aber kann das sein, dass Nachrichten in der Poisonqueue einen Exchangeserver lahmlegen können? Frei nach dem Motto: It's not a bug, it's a feature...

    • Als Antwort markiert weeeman Donnerstag, 21. Oktober 2010 11:22
    Donnerstag, 21. Oktober 2010 11:22