none
Exchange 2003 SP2 in Cluster rallentamenti code rallentate RRS feed

  • Domanda

  • Ho un Exchange 2003 SP2 in Cluster, configurato che esce tramite ISA ed entra dopo essere passato da un appliance Sophos, che da qualche giorno invia e riceve (sia dall'interno che dall'esterno)le mail con ritardi di circa 2 min.
    Ho notato facendo un tracking che tra la fase di Message Submitted to Advanced Queuing e StartedMessage Submission to Advanced Queue passano 2 minuti , cosa che non accadeva in precedenza.

    Nelle code mi trovo tanti domini vuoti, con 0 number of message e nei message pending submission ci sono sempre una 60ina di mail(non sempre le stesse).

    Ho già provato anche a riavviare + volte il servizio SMTP, e ricreare il connettore, cancellare il contenuto della cartella queue, ma le code vuote rimangono li . Ho diabilitato anche l'antivirus SMSE, ma il risultato nnon cambia.

    L'unica differenza sono stati gli aggiornamenti di Microsoft KB2467659,KB2443685,KB2443105,2440591,2436673,2423089,2387149,979687,2378111,2360937,2347290,2345886,2296199981322,2296011,2259922,982132,2141007,2124261,2121546,975558, e un invio massivo di mail il 23di 2 utenti che hanno incasinato un pò il server.

    Nel frattempo anche il primo nodo del Cluster ha iniziato ad avere dei problemmi e mi sono accorto che non riesco a telnettare + ne la porta 25 ne 80.

    Spero di essere stato chiaro.

    Grazie

    • Tipo modificato Anca Popa giovedì 20 gennaio 2011 09:20 attesa di feedback
    • Tipo modificato Anca Popa venerdì 28 gennaio 2011 11:51 domanda con risposta
    martedì 11 gennaio 2011 17:55

Risposte

  • Allora scusate il ritardo nella risposta ma sono stato un pò preso, con i problemi di Exchange e varie.

    Dopo un pò di verifiche ho notato che c'erano messaggio inchiodati sulle code del primo nodo del cluster, ed ho approfittato per riavviare sul nodo incriminato, disabilitato le code in uscita e cancellato quelle nella local delivery. Questo ha fatto si che le code sul primo nodo uscissero anche se con ritardo di 1 o 2 min.

    Ho aperto un case in microsoft, per farmi fare un'analisi e cercare la soluzione. Dopo il BPA mi hanno consigliato di fare queste modifiche:

    B.     Configurare il software antivirus seguendo le istruzioni contenute nell’articolo http://support.microsoft.com/kb/823166 - Overview of Exchange Server 2003 and antivirus software. Una volta modificate le impostazioni, riavviare i servizi msexchangeis, resvc e smtpsvc (in ambiente cluster questo significa portare le risorse offline e nuovamente online)

     

    C.       In base al report dell’Exchange BPA, effettuare le seguenti modifiche:

    ·          Exchange mailbox server nodo1 (and Nodo2) has 1 GB or more of memory, accommodates 853 mailboxes, and does not have /3GB set in the Boot.ini file. Greater scalability would be achieved if this were set. Memory detected: 24572 MB.

    http://technet.microsoft.com/en-ie/library/aa996130(en-us,EXCHG.80).aspx

    ·          Server nodo1 (and nodo2 ) has 1 GB or more of memory, accommodates 853 mailboxes, and the 'HeapDeCommitFreeBlockThreshold' parameter has not been set to 262144. Virtual memory may become quickly fragmented and system instability may occur. http://technet.microsoft.com/en-ie/library/aa998162(en-us,EXCHG.80).aspx

    ·          The number of virus scanning API threads on server fiera-mail1.fieramilanospa.local is too low and may cause performance degradation. Current number of threads: 9. Based on the current hardware configuration, a value of 33 is recommended.

    http://technet.microsoft.com/en-ie/library/aa997059(en-us,EXCHG.80).aspx

     

    D.       Facendo riferimento all’articolo http://support.microsoft.com/kb/948496/ - An update to turn off default SNP features is available for Windows Server 2003-based and Small Business Server 2003-based computers, disabilitare le funzioni RSS e TCP-Offload dalle schede di rete dei server nodo1 e nodo 2 e di tutti i Domain Controller, sia da Registro che dalle proprietá delle schede di rete stesse:

    - Cliccare su Start->Esegui-> ncpa.cpl e cliccare su OK

    - Cliccare sulla connessione di rete interessata con il tasto destro e dal menu contestuale selezionare Proprietà

    - Cliccare su "Configura" nella finestra delle proprietà della scheda di rete

    - Dovrebbe eserci un tab "Avanzate"

    - Nella lista delle proprietà diabilitare Receive Side Scaling e TCP/IP Offload

    - Ripetere queste operazioni per ogni scheda di rete presente

    Per disabilitarle nello stack TCP IP modificare le seguenti chiavi di regitro (sono settaggi descritti nella KB http://support.microsoft.com/kb/948496 ):

    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters

    EnableTCPChimney

    Type: REG_DWORD  Value: 0

    EnableRSS

    Type: REG_DWORD  Value: 0

    EnableTCPA

    Type: REG_DWORD  Value: 0

     

    Una volta effettuate le precedenti operazioni, nel caso il problema non fosse risolto o non fosse riscontrabile alcun miglioramento nelle prestazioni, procedere come segue per la raccotla di ulteriori dati:

     

    1.        Da Message Tracking Center individuare un messaggio in cui sia visibile ed elevato il ritardo, esportarlo in formato XML ed inviarlo per l’analisi.

    2.        Installare sul server nodo 2 il tool MetabaseCheck (in allegato), il path di default dell’installazione é C:\Program Files\Microsoft\ExMetabaseChecker. Eseguire il tool, selezionare sempre “Next”, verso la fine compariranno due caselle, NON SELEZIONARLE e procedere fino alla fine. Nel path di installazione verrá generato un log, inviarlo per l’analisi.

    Nel frattempo ho fatto le modifiche suggerite e fatto uno switch dei nodi per restartare i servizi.

    Il risultato è stato un crash del Cluster e neanche facendo uno switch abbiamo risolto la problematica. Da un altra analisi fatta a volo da microsoft è risultato che la problematica era dovuta dal team di HP, non supportato da microsoft http://support.microsoft.com/kb/254101 - Network adapter teaming and server clustering, spaccato il team e tutto sembrava funzionare.

    Però dopo un giorno di lavoro, da quasi scarico, ancora crash sul cluster con errori system application popup id 33, fatta un ulteriore ricerca ho letto l'articolo http://blogs.technet.com/b/itasupport/archive/2008/11/17/analizzare-l-evento-application-popup-333.aspx e tolta l'opzione /3GB /userva=3030 , dal boot.ini, suggerita da microsoft, sembra essersi ripristinato tutto.

     

    Ora sembra tutto funzionante, e rimango in attesa di un'analisi approfondita da supporto microsoft per capire cosa ha scaturito tutto, vi aggiornerò se ho ulteriori news.

     


    • Contrassegnato come risposta Anca Popa venerdì 28 gennaio 2011 11:53
    venerdì 28 gennaio 2011 10:43

Tutte le risposte

  • Ho un Exchange 2003 SP2 in Cluster, configurato che esce tramite ISA ed entra dopo essere passato da un appliance Sophos, che da qualche giorno invia e riceve (sia dall'interno che dall'esterno)le mail con ritardi di circa 2 min.
    Ho notato facendo un tracking che tra la fase di Message Submitted to Advanced Queuing e StartedMessage Submission to Advanced Queue passano 2 minuti , cosa che non accadeva in precedenza.

    Nelle code mi trovo tanti domini vuoti, con 0 number of message e nei message pending submission ci sono sempre una 60ina di mail(non sempre le stesse).

    Ho già provato anche a riavviare + volte il servizio SMTP, e ricreare il connettore, cancellare il contenuto della cartella queue, ma le code vuote rimangono li . Ho diabilitato anche l'antivirus SMSE, ma il risultato nnon cambia.

    L'unica differenza sono stati gli aggiornamenti di Microsoft KB2467659,KB2443685,KB2443105,2440591,2436673,2423089,2387149,979687,2378111,2360937,2347290,2345886,2296199981322,2296011,2259922,982132,2141007,2124261,2121546,975558, e un invio massivo di mail il 23di 2 utenti che hanno incasinato un pò il server.

    Nel frattempo anche il primo nodo del Cluster ha iniziato ad avere dei problemmi e mi sono accorto che non riesco a telnettare + ne la porta 25 ne 80.

    Spero di essere stato chiaro.

    Grazie


    Stamattina mi hanno segnalato che il ritardo era superiore a 1/2 ora....
    mercoledì 12 gennaio 2011 08:35
  • Ciao Solz, io comincierei con un riavvio del cluster.

    prima il nodo passivo, dopo quello attivo.

     

    Hai configurato i filtri IMF e l'esclusione di non accettare destinatari non presenti in directory?

    rallentamenti di questo tipo li ho avuti quando c'erano tantissimi NDR e il server riceveva molti spam indirizzati ad indirizzi inesistenti.

     

    HTH, fammi sapere.

    Ciao!


    Diego Castelli - MCSA 2003, MCP ISA 2004, MCTS Forefront. ITA: Questo post è fornito "così com'è". Non conferisce garanzie o diritti di alcun tipo. Ricorda di usare la funzione "segna come risposta" per i post che ti hanno aiutato a risolvere il problema e "deseleziona come risposta" quando le risposte segnate non sono effettivamente utili. Questo è particolarmente utile per altri utenti che leggono il thread, alla ricerca di soluzioni a problemi similari. ENG: This posting is provided "AS IS" with no warranties, and confers no rights. Please remember to click "Mark as Answer" on the post that helps you, and to click "Unmark as Answer" if a marked post does not actually answer your question. This can be beneficial to other community members reading the thread.
    mercoledì 12 gennaio 2011 09:21
  • Hai switchato l'instanza del cluster su un nodo riavviato? Non vorrei sia un problema di memoria nonpaged

     


    Peppacci - MVP - Microsoft Exchange Server Microsoft MCTS - MCITP http://blogs.sysadmin.it/peppacci/Default.aspx
    mercoledì 12 gennaio 2011 09:21
    Moderatore
  • Ho già swichato i nodi, ma quasi sicuramente quando ho switchato non avevo fatto un restart preventivo sul nodo passivo, sarebbe il caso farlo? e nel caso qualìè la procedura corretta?.

    Invece non ho configurato IMF perchè ho già un appliance AntiSpam che blocca, in effetti potrebbe essere che ho un pò di NDR, un paio di utenti mi hanno segnalato che ricevono NDR della stessa mail per lo stersso mittente + volte.

    mercoledì 12 gennaio 2011 10:31
  • IMF su macchine in cluster non funziona, al massimo potresti configurarlo su un eventuale front-end che riceve la posta.

    La procedura è semplice, riavvii il passivo poi dalla consule del cluadmin fa tasto dx sull'evs-->move group e selezioni il passivo appena riavviato.

    Il BPA hai provato a lanciarlo e vedere se ci sono ulteriori update e problematiche varie?


    Peppacci - MVP - Microsoft Exchange Server Microsoft MCTS - MCITP http://blogs.sysadmin.it/peppacci/Default.aspx
    mercoledì 12 gennaio 2011 14:24
    Moderatore
  • Fatto, ma il problema delle mail non cambia.

    Il BPA dà dei warning minimale, Potrebbe essere qualche cosa legato ad AD ?

    mercoledì 12 gennaio 2011 16:12
  • Ciao Solz,

    Comincia con:

    ESM -> impostazioni globali -> right-click su recapito messaggi -> scheda filtri destinatario.

    Verifica che sia spuntata: Filtra destinatari non presenti nella directory.

    poi:

    ESM-> espandi i tuoi admin group e vai nelle proprietà del server virtuale SMTP -> scheda generale, pulsante avanzate... -> modifica il listener opportuno (di default è uno solo) -> verifica che ci sia ALMENO la spunta applica filtro destinatario.

     

    Questo dovrebbe mettere fine ad eventuali "incolonnamenti" per NDR da indirizzi inesistenti.

     

    Dopodiche: io verificherei la struttura DNS.

    A quali DNS si appoggia il server Exchange? hai configurato degli external DNS nelle proprietà del server virtuale SMTP o di eventuali connettori?

    se no: controlla i server DNS che sono configurati nella scheda di rete del server di posta. Come fanno le query verso internet? forwarders? root hints? Check di eventuali server forwarders.
    controlla a che livello di aggiornamenti sei perchè mi sembra che un paio di anni fa ci sia stata qualche sostituzione nei root hints... anche se non sono sicuro.

    se si: controlla che quei server siano ancora tutti disponibili (usa lo strumento nslookup <invio> server <ip del server> <invio> set type=mx <invio> <nome_di_un_dominio esterno_problematico> <invio>

     

    Se si dovesse evincere che ci sono problemi con il DNS, vedi qui:

    http://support.microsoft.com/kb/816567

     

     

    Ciao!!!!


    Diego Castelli - MCSA 2003, MCP ISA 2004, MCTS Forefront. ITA: Questo post è fornito "così com'è". Non conferisce garanzie o diritti di alcun tipo. Ricorda di usare la funzione "segna come risposta" per i post che ti hanno aiutato a risolvere il problema e "deseleziona come risposta" quando le risposte segnate non sono effettivamente utili. Questo è particolarmente utile per altri utenti che leggono il thread, alla ricerca di soluzioni a problemi similari. ENG: This posting is provided "AS IS" with no warranties, and confers no rights. Please remember to click "Mark as Answer" on the post that helps you, and to click "Unmark as Answer" if a marked post does not actually answer your question. This can be beneficial to other community members reading the thread.
    venerdì 14 gennaio 2011 10:13
  • Ciao Solz,

    Il tuo thread è ancora aperto. Se hai più di tempo per esaminare il problema e darci maggiori dettagli, rimaniamo in attesa dei tuoi commenti.

    Se il problema è stato risolto, vorrei chiederti cortesemente di condividere la soluzione con la community, sarà molto utile per gli altri membri che riscontrano lo stesso problema. 

    Grazie in anticipo della tua collaborazione!


    Anca Popa Follow ForumTechNetIt on Twitter

    Exchange 2007/2010: problemi con le cartelle pubbliche: “The Active Directory user wasn’t found” 

    Microsoft offre questo servizio gratuitamente, per aiutare gli utenti e aumentare il database dei prodotti e delle tecnologie Microsoft. Il contenuto viene fornito “così come è” e non comporta alcuna responsabilità da parte di Microsoft. 

    martedì 18 gennaio 2011 20:36
  • Scusate se non ho risposto prima ma sono stato super impeganto, e non sono riuscito arispondere prima.

    Domani vi aggiorno con quello che ho fatto.

     

    Grazie

    mercoledì 26 gennaio 2011 18:56
  • Allora scusate il ritardo nella risposta ma sono stato un pò preso, con i problemi di Exchange e varie.

    Dopo un pò di verifiche ho notato che c'erano messaggio inchiodati sulle code del primo nodo del cluster, ed ho approfittato per riavviare sul nodo incriminato, disabilitato le code in uscita e cancellato quelle nella local delivery. Questo ha fatto si che le code sul primo nodo uscissero anche se con ritardo di 1 o 2 min.

    Ho aperto un case in microsoft, per farmi fare un'analisi e cercare la soluzione. Dopo il BPA mi hanno consigliato di fare queste modifiche:

    B.     Configurare il software antivirus seguendo le istruzioni contenute nell’articolo http://support.microsoft.com/kb/823166 - Overview of Exchange Server 2003 and antivirus software. Una volta modificate le impostazioni, riavviare i servizi msexchangeis, resvc e smtpsvc (in ambiente cluster questo significa portare le risorse offline e nuovamente online)

     

    C.       In base al report dell’Exchange BPA, effettuare le seguenti modifiche:

    ·          Exchange mailbox server nodo1 (and Nodo2) has 1 GB or more of memory, accommodates 853 mailboxes, and does not have /3GB set in the Boot.ini file. Greater scalability would be achieved if this were set. Memory detected: 24572 MB.

    http://technet.microsoft.com/en-ie/library/aa996130(en-us,EXCHG.80).aspx

    ·          Server nodo1 (and nodo2 ) has 1 GB or more of memory, accommodates 853 mailboxes, and the 'HeapDeCommitFreeBlockThreshold' parameter has not been set to 262144. Virtual memory may become quickly fragmented and system instability may occur. http://technet.microsoft.com/en-ie/library/aa998162(en-us,EXCHG.80).aspx

    ·          The number of virus scanning API threads on server fiera-mail1.fieramilanospa.local is too low and may cause performance degradation. Current number of threads: 9. Based on the current hardware configuration, a value of 33 is recommended.

    http://technet.microsoft.com/en-ie/library/aa997059(en-us,EXCHG.80).aspx

     

    D.       Facendo riferimento all’articolo http://support.microsoft.com/kb/948496/ - An update to turn off default SNP features is available for Windows Server 2003-based and Small Business Server 2003-based computers, disabilitare le funzioni RSS e TCP-Offload dalle schede di rete dei server nodo1 e nodo 2 e di tutti i Domain Controller, sia da Registro che dalle proprietá delle schede di rete stesse:

    - Cliccare su Start->Esegui-> ncpa.cpl e cliccare su OK

    - Cliccare sulla connessione di rete interessata con il tasto destro e dal menu contestuale selezionare Proprietà

    - Cliccare su "Configura" nella finestra delle proprietà della scheda di rete

    - Dovrebbe eserci un tab "Avanzate"

    - Nella lista delle proprietà diabilitare Receive Side Scaling e TCP/IP Offload

    - Ripetere queste operazioni per ogni scheda di rete presente

    Per disabilitarle nello stack TCP IP modificare le seguenti chiavi di regitro (sono settaggi descritti nella KB http://support.microsoft.com/kb/948496 ):

    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters

    EnableTCPChimney

    Type: REG_DWORD  Value: 0

    EnableRSS

    Type: REG_DWORD  Value: 0

    EnableTCPA

    Type: REG_DWORD  Value: 0

     

    Una volta effettuate le precedenti operazioni, nel caso il problema non fosse risolto o non fosse riscontrabile alcun miglioramento nelle prestazioni, procedere come segue per la raccotla di ulteriori dati:

     

    1.        Da Message Tracking Center individuare un messaggio in cui sia visibile ed elevato il ritardo, esportarlo in formato XML ed inviarlo per l’analisi.

    2.        Installare sul server nodo 2 il tool MetabaseCheck (in allegato), il path di default dell’installazione é C:\Program Files\Microsoft\ExMetabaseChecker. Eseguire il tool, selezionare sempre “Next”, verso la fine compariranno due caselle, NON SELEZIONARLE e procedere fino alla fine. Nel path di installazione verrá generato un log, inviarlo per l’analisi.

    Nel frattempo ho fatto le modifiche suggerite e fatto uno switch dei nodi per restartare i servizi.

    Il risultato è stato un crash del Cluster e neanche facendo uno switch abbiamo risolto la problematica. Da un altra analisi fatta a volo da microsoft è risultato che la problematica era dovuta dal team di HP, non supportato da microsoft http://support.microsoft.com/kb/254101 - Network adapter teaming and server clustering, spaccato il team e tutto sembrava funzionare.

    Però dopo un giorno di lavoro, da quasi scarico, ancora crash sul cluster con errori system application popup id 33, fatta un ulteriore ricerca ho letto l'articolo http://blogs.technet.com/b/itasupport/archive/2008/11/17/analizzare-l-evento-application-popup-333.aspx e tolta l'opzione /3GB /userva=3030 , dal boot.ini, suggerita da microsoft, sembra essersi ripristinato tutto.

     

    Ora sembra tutto funzionante, e rimango in attesa di un'analisi approfondita da supporto microsoft per capire cosa ha scaturito tutto, vi aggiornerò se ho ulteriori news.

     


    • Contrassegnato come risposta Anca Popa venerdì 28 gennaio 2011 11:53
    venerdì 28 gennaio 2011 10:43
  • Ti ringrazio del feedback, la tua esperienza potrebbe servire ad altri membri della community.  

    Ciao.


    Anca Popa Follow ForumTechNetIt on Twitter

    Exchange 2007/2010: problemi con le cartelle pubbliche: “The Active Directory user wasn’t found” 

    Microsoft offre questo servizio gratuitamente, per aiutare gli utenti e aumentare il database dei prodotti e delle tecnologie Microsoft. Il contenuto viene fornito “così come è” e non comporta alcuna responsabilità da parte di Microsoft. 

    venerdì 28 gennaio 2011 11:55