none
Rallentamento dovuto ad accesso continuo ai dischi RRS feed

  • Domanda

  • Ho un server HP Proliant con due gruppi di dischi in RAID1.
    Dopo aver riavviato da un Windows Update ed un aggiornamento al firmware della scheda di rete e del controller scsi E200i il server ha iniziato a rallentare vistosamente a causa di un accesso continuo ai dischi (i led sono sempre accesi).  Usando vari tools ho visto che la cpu e` scarica e non ci sono accessi "strani" al file system, quindi sembrerebbe essere un problema a basso livello, magari dovuto ad un baco di qualche drivers...  Non serve riavviare o spegnere la macchina, in quanto appena parte Windows la cosa ricomincia.  Non e` un problema di ricostruzione del raid (che comunqe non occuperebbe i dischi al 95%).
    Cosa puo` essere?
    Grazie
    giovedì 2 dicembre 2010 19:42

Risposte

  • ...torno adesso...    Ebbene era proprio la scheda di rete: dopo averla flashata era come impazzita e bloccava il sistema a forza di interrupt!  Adesso l'ho riflashata nuovamente e sembra essere tornata "normale". Per verificare la mia ipotesi sono andato a vedere la diagnostica dello switch a cui e` connesso il server ed in effetti era sommerso da pacchetti errati !  Certo che era difficile pensare a questo componente quando tutti i sintomi portavano a pensare che fosse il sottosistema dei dischi (oltretutto non capisco perche` i led dei raid stanno sempre accesi) ed in effetti nemmeno il service HP ci e` arrivato !
    Comunque grazie a tutti per esservi prodigati di consigli !  Alla prossima!
    lunedì 6 dicembre 2010 12:13

Tutte le risposte

  • Ho un server HP Proliant con due gruppi di dischi in RAID1.
    Dopo aver riavviato da un Windows Update ed un aggiornamento al firmware della scheda di rete e del controller scsi E200i il server ha iniziato a rallentare vistosamente a causa di un accesso continuo ai dischi (i led sono sempre accesi).  Usando vari tools ho visto che la cpu e` scarica e non ci sono accessi "strani" al file system, quindi sembrerebbe essere un problema a basso livello, magari dovuto ad un baco di qualche drivers...  Non serve riavviare o spegnere la macchina, in quanto appena parte Windows la cosa ricomincia.  Non e` un problema di ricostruzione del raid (che comunqe non occuperebbe i dischi al 95%).
    Cosa puo` essere?
    Grazie

    ...ovviamente l'event viewer non segnala alcunche` e la coda del disco e` pressoche` 0, da cui il sospetto che sia un problema a basso livello...
    giovedì 2 dicembre 2010 19:48
  • immaginando che usi un controller raid ossia il raid lo fai a livello di hw devi utilizzare le sue utility specifiche, l'os non si accorge di nulla che sta sotto di lui.

    Guarda da li che succede... se riesci e se si può prova a fare un controllo se è necessario upgradare anche il firmware dei dischi, altrimenti valuta un downgrade del firmware del controller. Tutto, comunque, dipende da quel che risponde l'utility.
    Sarebbe utile sapere anche il tipo di controller usato...

    ciao


    Roberto Pallucchini
    *** Please mark as Answer, if this reply helps you ***
    *** Per favore Suggerisci come risposta, se la risposta ti è stata di aiuto ***
    giovedì 2 dicembre 2010 19:59
  • Si in effetti sono proprio le utility del controller raid (hp Smart Array E200i) a dire che e` tutto ok.
    giovedì 2 dicembre 2010 20:13
  • Se non sbaglio si tratta di un controller per dischi SATA.

    La prima cosa che farei è abilitare la cache "Drive Write Cache (DWC)" che migliora notevolmente le performance dei dischi.

    Per quanto rioguarda l'attività disco, potrebbe trattarsi di qualche processo di indicizazione o di un problema con l'antivirus dopo l'update.

    Se parti in "safe mode" hai la stessa attività disco ?


    Fabrizio Volpe
    MCSE (NT4)(2000)(2003) - MCSA (2003)
    MCTS (SQL 2005)(Exchange 2007)(Windows 2008)
    Fortinet Certified Network Security Professional (FCNSP)
    Fabrizio[_dot_]Volpe[_at_]GMX[_dot_]com
    giovedì 2 dicembre 2010 20:17
  • Si, i dischi sono SATA.
    Antivirus no perche` non c'e`, l'indicizzazione e`disabilitata...
    In safe mode non ho provato, domani provero`!
    La DWC da dove si abilita?
    giovedì 2 dicembre 2010 20:24
  • Antivirus no perche` non c'e`

    Fermo li.

    Se non c'è l'antivirus, direi che abbiamo un potenziale sospetto grande come una casa.

    Fai ASSOLUTAMENTE un controllo spyware / virus e poi parliamo delle altre possibili cause.


    Fabrizio Volpe
    MCSE (NT4)(2000)(2003) - MCSA (2003)
    MCTS (SQL 2005)(Exchange 2007)(Windows 2008)
    Fortinet Certified Network Security Professional (FCNSP)
    Fabrizio[_dot_]Volpe[_at_]GMX[_dot_]com
    giovedì 2 dicembre 2010 22:16
  • No no, virus, worm, troiani, rootkit, non c'e` niente. Sicuro!  Oltretutto e` isolato da internet, non ha nemmeno il Def.Gw.
    Ho un sospetto sulla scheda di rete: domani controllo!
    venerdì 3 dicembre 2010 17:00
  • No no, virus, worm, troiani, rootkit, non c'e` niente. Sicuro!  Oltretutto e` isolato da internet, non ha nemmeno il Def.Gw.
    Ho un sospetto sulla scheda di rete: domani controllo!

    ...poi non e` che se non c'e` l'antivirus debba per forza esserci qualche malware!  Sul mio pc non ho MAI avuto un antivirus residente eppure non mi sono mai preso un virus (ogni tanto ovviamente verifico off-line).
    venerdì 3 dicembre 2010 18:29
  • Hai installato questo:

    The HP Smart Array SAS/SATA Event Notification Service provides event notification to the Windows Server 2003 and Windows Server 2008 system event log and the HP ProLiant Integrated Management Log for systems using the HP Smart Array SAS/SATA controller driver.??

    Non riporta nulla?

    Potresti dire quale update del firmware hai installaro (versione, edizione, release.....)?

    Per finire, avendo aggiornato il firmware  (e sembra che questo ne sia la conseguenza), hai provato a contattare il centro assistenza hp? Non mi sembra sia un problema causato dal s.o. (che non mi sembra che tu specifichi nei vari post.


    Adriano Mariolini MCITP Server Administrator MCTS Windows Server 2008 Applications Infrastructure, Configuration adriano.mariolini[at]my.sysadmin.it
    venerdì 3 dicembre 2010 19:18
  • Si, installato e non riporta niente. Il s.o. e` Win 2003 server R2. Il service HP non sa che pesci pigliare, per loro e` tutto a posto!
    Pero` a mente fredda mi sta venendo in mente che ho aggiornato anche il firmware della scheda di rete del Proliant ML350 G5 e potrebbe essere anche quella che e` impazzita...
    venerdì 3 dicembre 2010 19:30
  • mi sembra strano... puoi specificare la versione del firmware installat0?

    Adriano Mariolini MCITP Server Administrator MCTS Windows Server 2008 Applications Infrastructure, Configuration adriano.mariolini[at]my.sysadmin.it
    venerdì 3 dicembre 2010 19:39
  • Si, installato e non riporta niente. Il s.o. e` Win 2003 server R2. Il service HP non sa che pesci pigliare, per loro e` tutto a posto!
    Non è "a posto"... se non funziona... strano che non escano per la sostituzione...

    Adriano Mariolini MCITP Server Administrator MCTS Windows Server 2008 Applications Infrastructure, Configuration adriano.mariolini[at]my.sysadmin.it
    venerdì 3 dicembre 2010 19:40
  • Il firmware e` il 1.86, l'ultimo disponibile.  Il service non esce se non ha un errore conclamato! Per loro potrebbe essere un problema del s.op.  In effetti ho postato qui per essere certo di non aver trascurato nulla e a questo punto penso che il "povero" Windows non ne possa niente!
    In effetti il problema si presenta anche bootstrappando con WinPe/cd per cui...
    venerdì 3 dicembre 2010 19:55
  • No no, virus, worm, troiani, rootkit, non c'e` niente. Sicuro!  Oltretutto e` isolato da internet, non ha nemmeno il Def.Gw.
    Ho un sospetto sulla scheda di rete: domani controllo!

    ...poi non e` che se non c'e` l'antivirus debba per forza esserci qualche malware!  Sul mio pc non ho MAI avuto un antivirus residente eppure non mi sono mai preso un virus (ogni tanto ovviamente verifico off-line).

    ...tra l'altro un eventuale worm che accedesse di continuo al disco verrebbe rivelato dal Performance Monitor come coda di accesso al disco ed altri tools (come quelli di Sysinternals) che invece lo vedono pressoche` a zero, scarico!
    venerdì 3 dicembre 2010 20:07
  • 1.86(B)....

     


    Adriano Mariolini MCITP Server Administrator MCTS Windows Server 2008 Applications Infrastructure, Configuration adriano.mariolini[at]my.sysadmin.it
    venerdì 3 dicembre 2010 20:10
  • Confermo: 1.86(B) !
    venerdì 3 dicembre 2010 20:17
  • Proviamo a cambiare strada: verificato errori sul disco? Eseguito un semplice controllo dei dischi?

    Adriano Mariolini MCITP Server Administrator MCTS Windows Server 2008 Applications Infrastructure, Configuration adriano.mariolini[at]my.sysadmin.it
    sabato 4 dicembre 2010 11:45
  • Si, tutto a posto!  Comunque me lo direbbe anche la diagnostica del raid.
    sabato 4 dicembre 2010 18:17
  • il raid può funzionare... anche con errori su uno dei dischi... eventualmente li replica..

    Adriano Mariolini MCITP Server Administrator MCTS Windows Server 2008 Applications Infrastructure, Configuration adriano.mariolini[at]my.sysadmin.it
    sabato 4 dicembre 2010 18:23
  • Quelli ad alto livello, del file system?  Comunque chkdsk e` ok.  Quelli fisici, a basso livello no, il controller li rileverebbe subito!
    sabato 4 dicembre 2010 23:05
  • Qualche processo che occupa troppa ram, o problemi sulla ram che impone il sistema di ricorrere la file di paging su disco?

    Prova a leggere qui:

    http://www.netsetup.it/index.php?option=com_content&view=article&id=23:monitorare-le-prestazioni-di-windows-server&catid=4:windows-server&Itemid=36


    Adriano Mariolini MCITP Server Administrator MCTS Windows Server 2008 Applications Infrastructure, Configuration adriano.mariolini[at]my.sysadmin.it
    domenica 5 dicembre 2010 11:10
  • Purtroppo no: e` la prima cosa che ho fatto!  Se cosi` fosse stato avrei visto la coda del disco molto lunga per attivita` sul file-system, invece coda praticamente a zero, attivita` sul disco di qualsiasi genere = 0, cpu=0 !
    Pero...  domani controllo la scheda di rete...  perche` e` l'unica cosa che non ho fatto e in teoria potrebbe essere anche quella che, se impazzita, mi occupa, tramite valanghe di irq e quindi dma, il sistema senza usare ne cpu ne disco...
    domenica 5 dicembre 2010 15:34
  • Allora : WinPE ti vede il raid ?

    Se si, allora si può pensare ad un errore hardware, se no restano aperte varie opzioni (tra cui eventuali malware, che non si escludono con un semplice Performance Monitor).

    Tra l'altro, se ci sono "valanghe" di richieste errate da parte dell'hardware, la prima cosa che sale è il numero di interrupt sulla CPU (cosa che potresti controllare)


    Fabrizio Volpe
    MCSE (NT4)(2000)(2003) - MCSA (2003)
    MCTS (SQL 2005)(Exchange 2007)(Windows 2008)
    Fortinet Certified Network Security Professional (FCNSP)
    Fabrizio[_dot_]Volpe[_at_]GMX[_dot_]com
    lunedì 6 dicembre 2010 08:37
  • ...torno adesso...    Ebbene era proprio la scheda di rete: dopo averla flashata era come impazzita e bloccava il sistema a forza di interrupt!  Adesso l'ho riflashata nuovamente e sembra essere tornata "normale". Per verificare la mia ipotesi sono andato a vedere la diagnostica dello switch a cui e` connesso il server ed in effetti era sommerso da pacchetti errati !  Certo che era difficile pensare a questo componente quando tutti i sintomi portavano a pensare che fosse il sottosistema dei dischi (oltretutto non capisco perche` i led dei raid stanno sempre accesi) ed in effetti nemmeno il service HP ci e` arrivato !
    Comunque grazie a tutti per esservi prodigati di consigli !  Alla prossima!
    lunedì 6 dicembre 2010 12:13
  • Per rispondere all'ultimo post: si e` vero, solo che prima che mi balenasse il sospetto non immaginavo che potesse essere una cosa del genere e quindi non sono andato a controllare gli interrupt con il p.m.  Stamattina ho fatto piu` in fretta a verificare la diagnostica dello switch e mi e` bastato.
    Per i virus certamente che non si scoprono con il p.m., al limite puoi monitorarne gli effetti.  Ho molti altri tools per farlo ma comunque essendo una macchina che amministro solo io ed essendo isolata da internet mi e` bastato poco per capire se fosse preda di vermacci !
    lunedì 6 dicembre 2010 12:26