none
Servidor trava e logs do travamento ñ são conclusivos. RRS feed

  • Pergunta

  • Olá, tudo bem?

    Estou com um problema em um cliente e não estou conseguindo resolver. É um Windows Server 2012 R2, rodando HYPER-V com 1 VM, SQL e IIS.
    Tem Hardware de folga p/ esses serviços, visto que foi super dimensionado no ato da compra, pensando em operar com mais VMs dentro dele.

    Efetuamos testes de Hardware e tudo OK.

    Quando os servidor trava, o seguinte acontece:

    - Não consigo acessar RDP, nem IIS, nem através do IDRAC, nem local;

    - Consigo acessar SMB e  curiosamente a VM hospedada nesse Server funciona corretamente, com todos os serviços de pé;

    - É necessário resetar o servidor através do IDRAC ou desligar e ligar no power (forçando o desligamento) para poder retomar o acesso ao sistema após sua reinicialização.

    - Curioso que parece apenas alguns serviços não funcionam, mas são os cruciais. E outros funcionam corretamente.

    No IDRAC não aparecem erros de hardware, também não pude ver uso intenso de processador, disco ou rede. O uso está bem abaixo dos 50%. Chequei log por log em todos os serviços. É como se tudo parasse desde o momento do "travamento" e só retornasse após a reinicialização. O curioso é que SMB e o HyperV funcionam bem.

    O servidor estava travando sempre por volta das 2:00 AM, mas ontem ele travou por volta das 4:30 PM também.
    Não tem nenhum serviço agendado próximo a esses horários.

    O Anti-Vírus é o Kaspersky e tbm ñ tem nenhum agendamento.

    Atualizações estão sendo feitas regularmente e não apresentam erro.

    Servidor possui backup baremetal e também backup do SQL, desativamos temporariamente e os travamentos também continuaram. Retomamos, pois ñ foi conclusivo.

    Ainda realizarei testes na rede, p/ saber se há algum bruteforce ou DoS (apesar de nada nos logs do firewall nem do Windows) ou se há algum ataque interno. Também contatei o desenvolvedor p/ avaliar se o IIS, bem como a aplicação apresentam alguma falha. Terei resposta disso ainda essa semana.

    Fora isso, alguma ideia?
    Agradeço muito.

    terça-feira, 23 de maio de 2017 13:10

Respostas

  • Ola Alexandre,

    Esse tipo de problema é sempre bem complicado e não existe um passo a passo e realmente o que você esta tentando e a forma mais correta encontrar. Eu conselho deixar rodando no servidor o 

    Sysinternals Process Utilities

    Assim que o servidor trava tente pegar o horário correto e filtre os logs no Sysinternals. 

    Quando o servidor entrar em modo de travamento, tente não desligar (sabemos que isso é quase impossível), mas seria legal deixar um team viewer local ou um VNC para tentar acessar a console do servidor e revisar os logs do sysintertnal em tempo real ou saber se algum serviço em "services.msc" está parando e travando o seu servidor. Muito importante verificar se os serviços de WMI estão respondendo de acordo em seu servidor e se os registros' de DLLs para os serviços de VSS estão 100% integro. Você pode registrar as dlls novamente, pois isso pode ocasionar travamento e parada de serviços:

    Segue DllS abaixo de acordo com a plataforma:

    64Bits:

    rem FILENAME: FIXVSS08.BAT rem net stop "System Event Notification Service" net stop "Background Intelligent Transfer Service" net stop "COM+ Event System" net stop "Microsoft Software Shadow Copy Provider" net stop "Volume Shadow Copy" cd /d %windir%\system32 net stop vss net stop swprv regsvr32 /s ATL.DLL regsvr32 /s comsvcs.DLL regsvr32 /s credui.DLL regsvr32 /s CRYPTNET.DLL regsvr32 /s CRYPTUI.DLL regsvr32 /s dhcpqec.DLL regsvr32 /s dssenh.DLL regsvr32 /s eapqec.DLL regsvr32 /s esscli.DLL regsvr32 /s FastProx.DLL regsvr32 /s FirewallAPI.DLL regsvr32 /s kmsvc.DLL regsvr32 /s lsmproxy.DLL regsvr32 /s MSCTF.DLL regsvr32 /s msi.DLL regsvr32 /s msxml3.DLL regsvr32 /s ncprov.DLL regsvr32 /s ole32.DLL regsvr32 /s OLEACC.DLL regsvr32 /s OLEAUT32.DLL regsvr32 /s PROPSYS.DLL regsvr32 /s QAgent.DLL regsvr32 /s qagentrt.DLL regsvr32 /s QUtil.DLL regsvr32 /s raschap.DLL regsvr32 /s RASQEC.DLL regsvr32 /s rastls.DLL regsvr32 /s repdrvfs.DLL regsvr32 /s RPCRT4.DLL regsvr32 /s rsaenh.DLL regsvr32 /s SHELL32.DLL regsvr32 /s shsvcs.DLL regsvr32 /s /i swprv.DLL regsvr32 /s tschannel.DLL regsvr32 /s USERENV.DLL regsvr32 /s vss_ps.DLL regsvr32 /s wbemcons.DLL regsvr32 /s wbemcore.DLL regsvr32 /s wbemess.DLL regsvr32 /s wbemsvc.DLL regsvr32 /s WINHTTP.DLL regsvr32 /s WINTRUST.DLL regsvr32 /s wmiprvsd.DLL regsvr32 /s wmisvc.DLL regsvr32 /s wmiutils.DLL regsvr32 /s wuaueng.DLL sfc /SCANFILE=%windir%\system32\catsrv.DLL sfc /SCANFILE=%windir%\system32\catsrvut.DLL sfc /SCANFILE=%windir%\system32\CLBCatQ.DLL net start "COM+ Event System"

    32bits:

    cd /d %windir%\system32
    net stop vss
    net stop swprv
    regsvr32 ole32.dll
    regsvr32 oleaut32.dll
    regsvr32 /i eventcls.dll
    regsvr32 vss_ps.dll
    vssvc /register
    regsvr32 /i swprv.dll
    regsvr32 es.dll
    regsvr32 stdprov.dll
    regsvr32 vssui.dll
    regsvr32 msxml.dll
    regsvr32 msxml3.dll
    regsvr32 msxml4.dll
    net start vss
    net start swprv

    Espero que ajude e qualquer coisa entre em contato.


    Vinicius Mozart || MVP - Cloud and Datacenter Management || vinicius.mozart@terra.com.br || http://www.wenz.com.br || Skype:vinicius.mozart


    quinta-feira, 25 de maio de 2017 18:45
    Moderador

Todas as Respostas

  • Olá,

    Todos os firmwares e drivers da máquinas estão atualizados?

    Aplicou todos os updates do Windows tanto VM como no Host?

    Desativa temporariamente o antivírus e monitora pra ver o que acontece

    Você tem Antivirus instalado no Host ou apenas nas VMs?


    MVP - Daniel Santos Blog: www.engdanielsantos.wordpress.com Twitter: @danielsantos_ti

    terça-feira, 23 de maio de 2017 14:13
  • Opa! Tudo bem Daniel? Obrigado pelo retorno. Eu não verifiquei isso, obrigado pela dica. Estou verificando firmwares e drivers e atualizando conforme o necessário.

    Tenho AV instalado em ambos. Os updates também foram aplicados.

    Vou fazer um teste, deixando o AV ligado após eu ter atualizado tudo isso. Tão breve quanto possível te darei um retorno.

    terça-feira, 23 de maio de 2017 19:38
  • Bom dia  Alexandre Barrionuevo R

    Tudo bem contigo?

    Grato pela participação no Fórum Microsoft TechNet.

    Por gentileza, realize os testes e nos de um retorno o mais breve possível.

    Atenciosamente,


    Guilherme Macedo S

    Esse conteúdo é fornecido sem garantias de qualquer tipo, seja expressa ou implícita

    TechNet Community Support

    Por favor, lembre-se de Marcar como Resposta as postagens que resolveram o seu problema. Essa é uma maneira comum de reconhecer aqueles que o ajudaram e fazer com que seja mais fácil para os outros visitantes encontrarem a resolução mais tarde.

    quarta-feira, 24 de maio de 2017 12:26
  • Olá tudo bem?

    Atualizei Drivers, BIOS, firmwares, atualizei o Windows da maquina física e da VM, mas não surtiu efeito. Não funcionou, o servidor físico ainda continua travando. E os testes de hardware estão OK, sem problema algum.

    Vocês tem mais alguma sugestão? Todos os dias de madrugada, próximo ao mesmo horário sempre, o micro trava. E não há nenhum JOB conhecido que está sendo feito no horário em questão.

    Farei hoje o teste de desativar o antivírus do micro local e da VM.

    Serviços de backup também serão desativados.

    Obrigado pela atenção.

    edit: o servidor é um DELL PowerEdge R630 com Intel Xeon E5-2620 v3 e 32gb de memória. A controladora é uma PERC H730 Mini. O servidor está operando com Windows Server 2012 R2

    quinta-feira, 25 de maio de 2017 15:47
  • Ola Alexandre,

    Esse tipo de problema é sempre bem complicado e não existe um passo a passo e realmente o que você esta tentando e a forma mais correta encontrar. Eu conselho deixar rodando no servidor o 

    Sysinternals Process Utilities

    Assim que o servidor trava tente pegar o horário correto e filtre os logs no Sysinternals. 

    Quando o servidor entrar em modo de travamento, tente não desligar (sabemos que isso é quase impossível), mas seria legal deixar um team viewer local ou um VNC para tentar acessar a console do servidor e revisar os logs do sysintertnal em tempo real ou saber se algum serviço em "services.msc" está parando e travando o seu servidor. Muito importante verificar se os serviços de WMI estão respondendo de acordo em seu servidor e se os registros' de DLLs para os serviços de VSS estão 100% integro. Você pode registrar as dlls novamente, pois isso pode ocasionar travamento e parada de serviços:

    Segue DllS abaixo de acordo com a plataforma:

    64Bits:

    rem FILENAME: FIXVSS08.BAT rem net stop "System Event Notification Service" net stop "Background Intelligent Transfer Service" net stop "COM+ Event System" net stop "Microsoft Software Shadow Copy Provider" net stop "Volume Shadow Copy" cd /d %windir%\system32 net stop vss net stop swprv regsvr32 /s ATL.DLL regsvr32 /s comsvcs.DLL regsvr32 /s credui.DLL regsvr32 /s CRYPTNET.DLL regsvr32 /s CRYPTUI.DLL regsvr32 /s dhcpqec.DLL regsvr32 /s dssenh.DLL regsvr32 /s eapqec.DLL regsvr32 /s esscli.DLL regsvr32 /s FastProx.DLL regsvr32 /s FirewallAPI.DLL regsvr32 /s kmsvc.DLL regsvr32 /s lsmproxy.DLL regsvr32 /s MSCTF.DLL regsvr32 /s msi.DLL regsvr32 /s msxml3.DLL regsvr32 /s ncprov.DLL regsvr32 /s ole32.DLL regsvr32 /s OLEACC.DLL regsvr32 /s OLEAUT32.DLL regsvr32 /s PROPSYS.DLL regsvr32 /s QAgent.DLL regsvr32 /s qagentrt.DLL regsvr32 /s QUtil.DLL regsvr32 /s raschap.DLL regsvr32 /s RASQEC.DLL regsvr32 /s rastls.DLL regsvr32 /s repdrvfs.DLL regsvr32 /s RPCRT4.DLL regsvr32 /s rsaenh.DLL regsvr32 /s SHELL32.DLL regsvr32 /s shsvcs.DLL regsvr32 /s /i swprv.DLL regsvr32 /s tschannel.DLL regsvr32 /s USERENV.DLL regsvr32 /s vss_ps.DLL regsvr32 /s wbemcons.DLL regsvr32 /s wbemcore.DLL regsvr32 /s wbemess.DLL regsvr32 /s wbemsvc.DLL regsvr32 /s WINHTTP.DLL regsvr32 /s WINTRUST.DLL regsvr32 /s wmiprvsd.DLL regsvr32 /s wmisvc.DLL regsvr32 /s wmiutils.DLL regsvr32 /s wuaueng.DLL sfc /SCANFILE=%windir%\system32\catsrv.DLL sfc /SCANFILE=%windir%\system32\catsrvut.DLL sfc /SCANFILE=%windir%\system32\CLBCatQ.DLL net start "COM+ Event System"

    32bits:

    cd /d %windir%\system32
    net stop vss
    net stop swprv
    regsvr32 ole32.dll
    regsvr32 oleaut32.dll
    regsvr32 /i eventcls.dll
    regsvr32 vss_ps.dll
    vssvc /register
    regsvr32 /i swprv.dll
    regsvr32 es.dll
    regsvr32 stdprov.dll
    regsvr32 vssui.dll
    regsvr32 msxml.dll
    regsvr32 msxml3.dll
    regsvr32 msxml4.dll
    net start vss
    net start swprv

    Espero que ajude e qualquer coisa entre em contato.


    Vinicius Mozart || MVP - Cloud and Datacenter Management || vinicius.mozart@terra.com.br || http://www.wenz.com.br || Skype:vinicius.mozart


    quinta-feira, 25 de maio de 2017 18:45
    Moderador
  • Bom dia,

    Por falta de retorno esta thread esta encerrada !

    Por gentileza, caso necessário abra uma nova thread.

    Atenciosamente,


    Guilherme Macedo S

    Esse conteúdo é fornecido sem garantias de qualquer tipo, seja expressa ou implícita

    TechNet Community Support

    Por favor, lembre-se de Marcar como Resposta as postagens que resolveram o seu problema. Essa é uma maneira comum de reconhecer aqueles que o ajudaram e fazer com que seja mais fácil para os outros visitantes encontrarem a resolução mais tarde.

    segunda-feira, 29 de maio de 2017 12:28
  • Daniel, Vinicius e Guilherme.

    Primeiramente muito obrigado pelo auxílio e pela disposição. As questões que vocês responderam, ajudaram a resolver problemas em outros dois clientes.

    Gostaria de compartilhar a solução que resolveu o caso específico desse Dell R630.

    Utilizamos o Acronis Backup Cloud para gerir o DR desse cliente em especial. Existia um JOB oculto dentro do painel do Acronis, que apesar de termos excluído anteriormente, ainda fazia backup durante a noite. Como fazia bastante tempo, somente fomos desconfiar do caso ao consultar documentações antigas deste Server.

    Ao descobrir que o JOB em questão ainda estava rodando no horário dos travamentos, entramos em contato com a Acronis e eles desativaram manualmente. Provavelmente a função de backup ficava presa em algum LOOP no SQL Server, na hora de realizar o backup.

    Após desativar, o servidor funcionou corretamente. Substituímos o backup SQL desse cliente por uma rotina automática por arquivos, sem utilizar o SQL.

    Mais uma vez agradeço o auxílio.

    terça-feira, 13 de junho de 2017 13:10