none
Windows Server 2003 web edition, perdita file al riavvio RRS feed

  • Discussione generale

  • Salve,

    avevo postato tempo fa un problema con questo sistema operativo relativamente a problemi con NTFS. Mi è stato suggerito di cambiare controller RAID (cosa effettuata), ma si è ripresentato nuovamente il problema di corruzione del file system. Abbiamo provveduto a cambiare nuovamente controller RAID con un modello differente, ed usare dischi nuovi.

    Quello che ci è successo è Venerdì notte: dopo l'installazione degli aggiornamenti è stato riavviato il server, ma non tutti i servizi si sono riavviati (in particolare alcuni nostri servizi e MySQL). Controllando abbiamo visto che mancavano alcune DLL ed EXE, oltre alla cartella del programma MySQL non era accessibile per problemi di protezione (accesso negato).

    Abbiamo ripristinato i file mancanti, per MySQL abbiamo rinominato la vecchia cartella perché non ci permetteva l'eliminazione (anche se non erano attivi handle o processi sulla cartella). Dopo questa operazione tutto a ripreso ad andare.

    Ora il problema è l'affidabilità del nostro Windows Server 2003, abbiamo letteralmente paura di riavviare la macchina. Dovremo comunque riavviarla, perché Domenica i checkdisk ritorna degli errori:

    WARNING! F parameter not specified.
    Running CHKDSK in read-only mode.
    
    CHKDSK is verifying files (stage 1 of 3)...
    Correcting a minor error in file 154329. Correcting a minor error in file 154330. Correcting a minor error in file 154331. 4 percent complete. (154455 of 361136 file records processed) Deleting corrupt attribute record (128, "") from file record segment 154952. Deleting corrupt attribute record (128, "") from file record segment 154953. Deleting corrupt attribute record (128, "") from file record segment 154954.
    361136 file records processed. File verification completed. 10 percent complete. (1 of 1346 large file records processed) 1013461346 1346 large file records processed. Errors found. CHKDSK cannot continue in read-only mode.

    Come dobbiamo comportarci? Segnalo che è un server in produttività, per cui non possiamo permetterci lunghi down o peggio perdite di dati.

    Riporto alcuni dati hardware del server:

    Intel Pentium 4 2,8 GHz

    Windows 2003 R2

    DELL CERC SATA 1.5/6ch RAID CONTROLLER

    2 HardDisk SATA da 400GB collegati in RAID 1

     

    Grazie, Marco.

    • Modificato ilcava martedì 19 ottobre 2010 08:36
    • Tipo modificato Anca Popa lunedì 25 ottobre 2010 09:12 attesa di feedback
    martedì 19 ottobre 2010 08:04

Tutte le risposte

  • Verifica se ci sono errori nel registro eventi, verifica poi se lo shutdown del server vviene correttamente.
    C'è un antivirus; disabilita tutto e fai la prova.
    Roberto Pallucchini
    *** Please mark as Answer, if this reply helps you***
    *** Per favore Suggerisci come risposta, se la risposta ti è stata di aiuto***
    martedì 19 ottobre 2010 08:16
  • Vorrei prima fare una precisazione: sarebbe più corretto dire "il problema è l'affidabilità del nostro Windows Server 2003" che "il problema è l'affidabilità di Windows Server 2003" perchè la frase lascia adito a molti dubbi in tutti coloro che leggeranno questo thread.

    Detto questo, il fatto che il sistema operativo segnali errori nel chkdsk non è certo di buon auspicio ed è inutile affermare che "non possiamo permetterci lunghi down o peggio perdite di dati". Qui va sanato il server a tutti i costi e al più presto.

    Proviamo a procedere per gradi: Dell cosa dice del suo controller e dei dischi ? Hai un backup completo di tutta la macchina ?


    Edoardo Benussi - Microsoft® MVP
    Management Infrastructure - Systems Administration
    https://mvp.support.microsoft.com/Profile/Benussi
    Windows Server Italian Forum Moderator
    edo[at]mvps[dot]org
    martedì 19 ottobre 2010 08:34
    Moderatore
  • L'evento log risulta pulito (ad eccezione degli errori dei servizi che non erano partiti), e lo shutdown è avvenuto senza nessun particolare avviso.

    Per l'antivirus (Symantec Client Sicurity 10.1.0.401) posso provare a disattivarlo. Vedo di programmare il test quanto prima.

    martedì 19 ottobre 2010 08:41
  • Come da sua segnalazione ho corretto il POST (mi scuso per il mio errore). Concordo con lei di "sanare" il computer quanto prima, per questo ho mandato il POST. Segnalo che abbiamo un backup completo della macchina, che ci ha permesso di ripristinare tutti i servizi quando abbiamo avuto il problema.

    Per DELL ritiene che il problema sia del FileSystem e non del loro hardware, ho controllato sul sito ed abbiamo la penultima versione del firmware. Non abbiamo provveduto all'aggiornamento all'ultima, non riscontrando nessun problema da loro corretto. Riporto il link con le note di rilascio:
    http://support.dell.com/support/downloads/download.aspx?c=us&cs=04&l=en&s=bsd&releaseid=R155588&SystemID=PWE_ITANIUM_750&servicetag=&os=NAA&osl=en&deviceid=5646&devlib=0&typecnt=0&vercnt=6&catid=-1&impid=-1&formatcnt=0&libid=41&typeid=FRMW&dateid=-1&formatid=-1&source=-1&fileid=207606

    Grazie, Marco.

    martedì 19 ottobre 2010 08:52
  • riporta gli errori che trovi nel registro eventi (uno per tipo) indicando la frequenza qualora questa fosse elevata.
    Edoardo Benussi - Microsoft® MVP
    Management Infrastructure - Systems Administration
    https://mvp.support.microsoft.com/Profile/Benussi
    Windows Server Italian Forum Moderator
    edo[at]mvps[dot]org
    martedì 19 ottobre 2010 09:10
    Moderatore
  • ma, banalmente, hai aggiornato Windows?

    Cache mode dei volumi (dalle proprietà del volume o del disco fisico, che poi è un disco logico del controller RAID HW...)? meglio disattivarla, quando ci sono problemi di questo tipo.

    Il controller che hai ha una cache hardware a batteria?

     

    HTH Ciao


    Diego Castelli - MCSA 2003, MCP ISA 2004, MCTS Forefront. ITA: Questo post è fornito "così com'è". Non conferisce garanzie o diritti di alcun tipo. Ricorda di usare la funzione "segna come risposta" per i post che ti hanno aiutato a risolvere il problema e "deseleziona come risposta" quando le risposte segnate non sono effettivamente utili. Questo è particolarmente utile per altri utenti che leggono il thread, alla ricerca di soluzioni a problemi similari. ENG: This posting is provided "AS IS" with no warranties, and confers no rights. Please remember to click "Mark as Answer" on the post that helps you, and to click "Unmark as Answer" if a marked post does not actually answer your question. This can be beneficial to other community members reading the thread.

    martedì 19 ottobre 2010 09:51
  • Come da lei richiesto le invio gli errori del registro System il giorno del problema:

    • Event Type:    Error
      Event Source:    Service Control Manager
      Event Category:    None
      Event ID:    7000
      Date:        16/10/2010
      Time:        8.08.23
      User:        N/A
      Computer:    SERVERNEW
      Description:
      The Parallel port driver service failed to start due to the following error:
      The service cannot be started, either because it is disabled or because it has no enabled devices associated with it.

      For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
    • Questo servizio è un nostro programma, non funzionava per i problemi di MySQL descritti sopra. Riporto comunque l'errore
      Event Type:    Error
      Event Source:    Service Control Manager
      Event Category:    None
      Event ID:    7022
      Date:        16/10/2010
      Time:        8.09.01
      User:        N/A
      Computer:    SERVERNEW
      Description:
      The 8CoderService service hung on starting.

      For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
    • Questo è un altro nostro servizio, non funzionava per i problemi di MySQL descritti sopra. Riporto comunque l'errore
      Event Type:    Error
      Event Source:    Service Control Manager
      Event Category:    None
      Event ID:    7022
      Date:        16/10/2010
      Time:        8.09.01
      User:        N/A
      Computer:    SERVERNEW
      Description:
      The EightMailing service hung on starting.

      For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
    • Event Type:    Error
      Event Source:    Service Control Manager
      Event Category:    None
      Event ID:    7034
      Date:        16/10/2010
      Time:        8.14.33
      User:        N/A
      Computer:    SERVERNEW
      Description:
      The MySQL service terminated unexpectedly.  It has done this 1 time(s).

      For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
    • Questo messaggio viene replicato più volte, vista l'importanza di tale servizio infatti è importato di tentare l'avvio in caso di errore. Scompare quando abbiamo finalmente risolto il problema.
      Event Type:    Error
      Event Source:    Service Control Manager
      Event Category:    None
      Event ID:    7031
      Date:        16/10/2010
      Time:        9.30.25
      User:        N/A
      Computer:    SERVERNEW
      Description:
      The MySQL service terminated unexpectedly.  It has done this 2 time(s).  The following corrective action will be taken in 300000 milliseconds: Restart the service.

      For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.

    Questi errori invece sono precedenti al problema:

    • Questo errore compare 2 volte ogni 2 settimane circa
      Event Type:    Warning
      Event Source:    Ftdisk
      Event Category:    Disk
      Event ID:    57
      Date:        10/10/2010
      Time:        11.04.50
      User:        N/A
      Computer:    SERVERNEW
      Description:
      The system failed to flush data to the transaction log. Corruption may occur.

      For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
      Data:
      0000: 00 00 00 00 01 00 be 00   ......¾.
      0008: 02 00 00 00 39 00 04 80   ....9..€
      0010: 00 00 00 00 0e 00 00 c0   .......À
      0018: 00 00 00 00 00 00 00 00   ........
      0020: 00 00 00 00 00 00 00 00   ........
    • Una solo occorrenza di quest'errore
      Event Type:    Error
      Event Source:    PlugPlayManager
      Event Category:    None
      Event ID:    12
      Date:        10/10/2010
      Time:        11.04.49
      User:        N/A
      Computer:    SERVERNEW
      Description:
      The device 'ST3400620AS' (IDE\DiskST3400620AS_____________________________3.AAC___\5&2f2045c6&0&0.0.0) disappeared from the system without first being prepared for removal.

      For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
      Data:
      0000: 00 00 00 00               ....    
    • Saltuariamente quest'errore
      Event Type:    Error
      Event Source:    Service Control Manager
      Event Category:    None
      Event ID:    7000
      Date:        10/10/2010
      Time:        3.04.35
      User:        N/A
      Computer:    SERVERNEW
      Description:
      The Parallel port driver service failed to start due to the following error:
      The service cannot be started, either because it is disabled or because it has no enabled devices associated with it.

      For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
    • Solo una occorrenza
      Event Type:    Error
      Event Source:    MRxSmb
      Event Category:    None
      Event ID:    8003
      Date:        08/10/2010
      Time:        0.08.28
      User:        N/A
      Computer:    SERVERNEW
      Description:
      The master browser has received a server announcement from the computer SERVERDEDICATO that believes that it is the master browser for the domain on transport NetBT_Tcpip_{1DA2C93F-7EF7. The master browser is stopping or an election is being forced.

      For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
      Data:
      0000: 00 00 00 00 03 00 4e 00   ......N.
      0008: 00 00 00 00 43 1f 00 c0   ....C..À
      0010: 00 00 00 00 00 00 00 00   ........
      0018: 00 00 00 00 00 00 00 00   ........
      0020: 00 00 00 00 00 00 00 00   ........
    • Una ventina di questi errori, durante una operazione di checkdisk con riparazione
      Event Type:    Error
      Event Source:    HTTP
      Event Category:    None
      Event ID:    15000
      Date:        07/10/2010
      Time:        21.50.33
      User:        N/A
      Computer:    SERVERNEW
      Description:
      Unable to create log file D:\LogFiles\W3SVC500361626. Make sure that the logging directory is correct and this computer has write access to that directory.

      For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
      Data:
      0000: 00 00 04 00 02 00 52 00   ......R.
      0008: 00 00 00 00 98 3a 00 c0   ....˜:.À
      0010: 00 00 00 00 00 00 00 00   ........
      0018: 00 00 00 00 00 00 00 00   ........
      0020: 00 00 00 00 00 00 00 00   ........
      0028: 22 00 00 c0               "..À    
    • Un unica ricorrenza (il giorno del down di Aruba)
      Event Type:    Error
      Event Source:    EventLog
      Event Category:    None
      Event ID:    6008
      Date:        06/10/2010
      Time:        11.17.57
      User:        N/A
      Computer:    SERVERNEW
      Description:
      The previous system shutdown at 10:52:33 AM on 10/6/2010 was unexpected.

      For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
      Data:
      0000: da 07 0a 00 03 00 06 00   Ú.......
      0008: 0a 00 34 00 21 00 df 00   ..4.!.ß.
      0010: da 07 0a 00 03 00 06 00   Ú.......
      0018: 08 00 34 00 21 00 df 00   ..4.!.ß.

    Nell'application abbiamo numerose occorrenze dell'errore seguente, da quando abbiamo avuto il problema e spariti alla risoluzione copiando nuovamente il motore del database:
    Event Type:    Error
    Event Source:    MySQL
    Event Category:    None
    Event ID:    100
    Date:        16/10/2010
    Time:        8.51.12
    User:        N/A
    Computer:    SERVERNEW
    Description:
    D:\mysql\bin\mysqld-nt: Incorrect information in file: '.\dbxxx\tablexxx.frm'

    For more information, see Help and Support Center at http://www.mysql.com. 

    Se volesse altri elementi non esiti a chiedere,
    Grazie Marco.

    martedì 19 ottobre 2010 10:20
  • Si, ho aggiornato Windows con gli aggiornamenti emessi durante la settimana.

    Il RAID è software, e i volumi dei dischi sono di tipo base (non sono dischi dinamici). La cache del controller è attiva solo per la lettura, quella di scrittura è disabilitata.

    A livello di Windows è attiva la voce: "Enable write caching on the disk"

    Abbiamo lasciato disattivata invece la voce: "Enable advanced performance"

    sono le impostazioni di default mi sembra. Ritieni di disabilitare l'opzione della cache di scrittura sul disco di windows, quella di lettura del RAID od entrambe?

    Ciao, Marco.

    martedì 19 ottobre 2010 10:36
    • Questo errore compare 2 volte ogni 2 settimane circa
      Event Type:    Warning
      Event Source:    Ftdisk
      Event Category:    Disk
      Event ID:    57
      Date:        10/10/2010
      Time:        11.04.50
      User:        N/A
      Computer:    SERVERNEW
      Description:
      The system failed to flush data to the transaction log. Corruption may occur.

      For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
      Data:
      0000: 00 00 00 00 01 00 be 00   ......¾.
      0008: 02 00 00 00 39 00 04 80   ....9..€
      0010: 00 00 00 00 0e 00 00 c0   .......À
      0018: 00 00 00 00 00 00 00 00   ........
      0020: 00 00 00 00 00 00 00 00   ........
    • Una solo occorrenza di quest'errore
      Event Type:    Error
      Event Source:    PlugPlayManager
      Event Category:    None
      Event ID:    12
      Date:        10/10/2010
      Time:        11.04.49
      User:        N/A
      Computer:    SERVERNEW
      Description:
      The device 'ST3400620AS' (IDE\DiskST3400620AS_____________________________3.AAC___\5&2f2045c6&0&0.0.0) disappeared from the system without first being prepared for removal.

    i due quotati sono gli errori, secondo me, direttamente correlati col problema.

    dopo il 10/10/2010 questi errori non ci sono più ? dopo il cambio del controller non ci sono più ?

    quanti dischi e quante partizioni hai su questa macchina ?


    Edoardo Benussi - Microsoft® MVP
    Management Infrastructure - Systems Administration
    https://mvp.support.microsoft.com/Profile/Benussi
    Windows Server Italian Forum Moderator
    edo[at]mvps[dot]org
    martedì 19 ottobre 2010 11:46
    Moderatore
  • La macchina ha 3 dischi, uno fuori RAID ormai non più usato e 2 in RAID 1 in uso.

    Infatti, prima dell'estate per un problema simile abbiamo cambiato totalmente RAID con un altro modello, che non risultava compatibile. Abbiamo quindi usato il disco singolo come base per ripristinare le partizioni. Questo ad oggi non viene montato, ma è comunque presente nel computer. L'errore di DOWN del HD è riferito effettivamente a questo disco, purtroppo per vari problemi non è ancora stato rimosso fisicamente dal computer (ci siamo dimenticati). Abbiamo per l'appunto previsto ora la sua rimozione per evitare possibili instabilità.

    Comunque gli errori più recenti di questo tipo sono il 10/10/2010.

    Ritenete che l'harddisk aggiuntivo sia la causa più probabile? Se è così aspetto a disattivare la cache per la scrittura dei dischi indicata nel messaggio precedente.

    Grazie, Marco.

     

    martedì 19 ottobre 2010 12:30
  • se il disco non è in uso o peggio aveva dato dei problemi scollegalo al volo.
    Disattiva il caching software visto che viene gestito dal controller.
    Aggiorna il firmware.

    ciao


    Roberto Pallucchini
    *** Please mark as Answer, if this reply helps you***
    *** Per favore Suggerisci come risposta, se la risposta ti è stata di aiuto***
    mercoledì 20 ottobre 2010 06:27
  • Come dicevo: disattiva la cache software.

    in più concordo con Roberto per la rimozione immediata del disco guasto.

    MI RACCOMANDO! CONTROLLA PRIMA CHE IL DISCO NON SIA ASSOLUTAMENTE IN USO (Swapping, logs, dati, etc....).

    Secondo me, con queste due cose andrai bene.

    Due curiosità:

    perchè il disco problematico sembra connesso su IDE?

    Se, come dici tu, il disco problematico non viene usato, come mai hai degli errori di scrittura relativi a files:

     ----Unable to create log file D:\LogFiles\W3SVC500361626. Make sure that the logging directory is correct and this computer has write access to that directory.  ----

    ???

    Controlla il seriale del disco e vedi che non sia quello di sistema....

     

    Ciao!


    Diego Castelli - MCSA 2003, MCP ISA 2004, MCTS Forefront. ITA: Questo post è fornito "così com'è". Non conferisce garanzie o diritti di alcun tipo. Ricorda di usare la funzione "segna come risposta" per i post che ti hanno aiutato a risolvere il problema e "deseleziona come risposta" quando le risposte segnate non sono effettivamente utili. Questo è particolarmente utile per altri utenti che leggono il thread, alla ricerca di soluzioni a problemi similari. ENG: This posting is provided "AS IS" with no warranties, and confers no rights. Please remember to click "Mark as Answer" on the post that helps you, and to click "Unmark as Answer" if a marked post does not actually answer your question. This can be beneficial to other community members reading the thread.
    mercoledì 20 ottobre 2010 08:51
  • Abbiamo disattivato la cache disco di Windows, lasciando attiva solo la cache del RAID in lettura, e stanotte verrà tolto il disco che continua a smontarsi.

    Per aggiornare il firmware del RAID la cosa è problematica, essendo il server in web farm, e questa dista 500km da noi. Quindi lo terrei in considerazione solo come opzione successiva a questi interventi.

    Vi informerò sulla situazione.

    Grazie, Marco.

     

    giovedì 21 ottobre 2010 08:17
  • Questa prima settimana sembra non esserci nessun problema, stiamo comunque continuando a monitorare il server ed effettuare backup del sistema i più vicini possibili.

    Terrò aggiornato questo thread sull'evolversi della situazione ancora per una settimana o due, dopo le quali spero di dichiarare chiuso il problema.

     

    Grazie, Marco.

    mercoledì 3 novembre 2010 08:27