none
Queda de Conexão Sql Server 2008 R2 RRS feed

  • Pergunta

  • Galera,

    Meu ambiente é o seguinte:

    Servidor Windows Server 2008 e Sql Server 2008 R2 está em um prédio A com rede A, as estações com sistema desktop acessam de um prédio com rede B a +/- 500 metros ligado por fibra óptica de 100Mb. O que ocorre é que frequentemente aparece erros de conexão aleatoriamente nas máquinas como se esporadicamente perdesse a conexão com o servidor. Não ocorre em todas as máquinas no mesmo momento e nem no mesmo horário todos os dias.

    Alguém tem idéia do que pode ser, se tem alguma configuração no SQLServer, no Windows ou no cliente que precisa ser ajustada?

    sexta-feira, 26 de abril de 2013 18:08

Respostas

  • Fala Paulo, blz?

    Passa pra gente o erro exato que aparece para o usuário. Você pode deixar o Perfmon rodando no servidor, e quando der o problema você verifica o gráfico pra obter alguma informação útil.

    Veja aqui informações em português dos principais contadores do SQL: http://sqldicas.com.br/dicas/perfmon-e-sql-server/

    Monitore também os seguintes contadores:

    Processor: Processor Time

    Memory: Available MB

    PageFile: % in use

    Physical Disk: Current Disk Queue Length (da unidade onde estão os dados do SQL)

    Tem antivírus instalado no servidor onde está o SQL Server?

    Verifique o horário quando ocorrer novamente e veja nos logs do Event Viewer de Application e System o que tem registrado no período de 10 minutos antes e depois.

    Veja como obter outras informações importantes do SQL Server através dos relatórios: http://sqldicas.com.br/dicas/relatorios-do-sql-2008/

    Ficamos no aguardo das respostas pra poder continuar te ajudando.

    Abs!


    Luiz Mercante
    MCITP SQL 2008 | MCTS SQL 2008 | MCTS Windows Apps | MCTS Windows Network | MCP 2003
    sqldicas@outlook.com
    http://sqldicas.com.br


    Se a resposta foi útil de alguma forma, classifique.


    segunda-feira, 29 de abril de 2013 00:42
    Moderador
  • Boa Tarde!

    Aconteceu a queda em uma das estações hoje às 10:19.

    Segue o gráfico da CPU, memória e disco: https://docs.google.com/file/d/0BxVfg83ssQ73U3ZCY2ZiaUt5eUE/edit?pli=1

    e o gráfico do sql: https://docs.google.com/file/d/0BxVfg83ssQ73LUJKMjJGelo4VTA/edit?pli=1

    Se não conseguir visualizar as imagens me dá uma dica de como postar, pois sou meio novato neste esquema de fórum.

    Percebi muita utilização de disco no momento da queda, mas não compreendi muito bem por causa da escala, será que estava utilizando 100% dos recursos de leitura de disco?

    Grato,
    Paulo



    Paulo, obrigado pelo retorno.

    Vamos ajustar a escala, vai ficar mais fácil de compreender o gráfico:

    Processor: Processor Time (vai de 0 a 100% - escala 1,0)

    Memory: Available MB (ajuste pois no seu caso está Available Bytes)

    PageFile: % in use (vai de 0 a 100% - escala 1,0)

    Physical Disk: Current Disk Queue Length (da unidade onde estão os dados do SQL) (coloque escala 1,0)

    Veja através do Page Life Expectancy que uma linha estável indica que as páginas não morrem, ou seja, estão sempre na memória;

    Com o Batch Requests/sec percebemos um aumento muito grande de batches sendo executadas naquele período onde o disco deu um baita salto. Possivelmente houve uma carga de dados a partir de um arquivo na mesma unidade, verifique nos jobs e nos logs dos jobs se algum job rodou naquele horário (10:18 a 10:21)

    Chegou a verificar nos logs do Event Viewer algum evento (info, warning ou error) no período?

    Tem antivírus instalado neste servidor?

    Somente uma estação recebeu o erro? Analisou o Event Viewer da estação no período?

    Deixa o servidor pingando uma máquina do outro prédio pra descartarmos possíveis problemas de conectividade (ping -t).

    Fico no aguardo dos resultados, abs!


    Luiz Mercante
    MCITP SQL 2008 | MCTS SQL 2008 | MCTS Windows Apps | MCTS Windows Network | MCP 2003
    sqldicas@outlook.com
    http://sqldicas.com.br


    Se a resposta foi útil de alguma forma, classifique.

    quinta-feira, 2 de maio de 2013 21:49
    Moderador
  • Bom dia Paulo.

    Não, as páginas ficarem na memória é o melhor comportamento possível. Significa que quando for feita uma query, ao invés de verificar que a página não está em memória, solicitar ao sub sistema de I/O que vai até o disco localizar as páginas que podem ainda estar fragmentadas, aguardar o retorno para então executar e entregar o resultado, já pega na memória os dados, processa e entrega. Este é um contador que quanto maior, melhor.

    Este evento ID3852 é apenas que o processo do DefaultAppPool foi encerrado por não estar sendo utilizado, normal.

    É muito difícil relacionar o problema a rede pois geralmente a aplicação trata pequenas perdas de pacote. É uma aplicação Web ou instalada na estação de trabalho?

    Só pra confirmar, no Event Viewer você olhou tanto os logs de aplicação quanto de sistema?

    Quantos usuários estão utilizando a aplicação?

    Assim com poucos detalhes é um tanto difícil de ajudar e todo o troubleshooting básico já fizemos. Seria muito bacana se você conseguir passar pra gente qual foi a causa quando descobrir.

    Espero ter ajudado, abs!


    Luiz Mercante
    MCITP SQL 2008 | MCTS SQL 2008 | MCTS Windows Apps | MCTS Windows Network | MCP 2003
    sqldicas@outlook.com
    http://sqldicas.com.br


    Se a resposta foi útil de alguma forma, classifique.

    sexta-feira, 3 de maio de 2013 15:31
    Moderador
  • Boa Tarde Luiz!

    Semana passada mudamos o servidor de sala, ele estava em um local provisório porque a sala estava em reforma (o sistema foi implantado nesta sala provisória), e desde então não ocorreu quedas, não sei se era o cabeamento de rede do local que ele estava, pois não estava direto no rack, mas também fiquei pensando, se for rede, não era pra dar perda de pacote ping? monitorei por muito tempo e o ping ficou 100%. Mas em todo caso fico torcendo pra ficar resolvido.

    Muito Obrigado pelas dicas!

    Grato,
    Paulo

    quarta-feira, 12 de junho de 2013 18:01

Todas as Respostas

  • Paulo,

    Os usuários estão com alguma mensagem de timeout de login do SQL Server? O SQL Server está em cluster? O que você poderia fazer é das maquinas desses usuarios realizar um tracert para o IP do SQL Server e verificar se existe algum timeout no meio do caminho.

    Outros passos seriam.

     - Verificar o event viewer do Windows para entender se algum erro acontece do lado do servidor.

    Se a resposta for útil, classifique-a


    Att,
    Marcos Freccia [MTA|MCTS|MCITP|MCT SQL Server 2008]
    Blog|Twitter
    Assine também os feeds clicando aqui

    sábado, 27 de abril de 2013 19:37
  • Fala Paulo, blz?

    Passa pra gente o erro exato que aparece para o usuário. Você pode deixar o Perfmon rodando no servidor, e quando der o problema você verifica o gráfico pra obter alguma informação útil.

    Veja aqui informações em português dos principais contadores do SQL: http://sqldicas.com.br/dicas/perfmon-e-sql-server/

    Monitore também os seguintes contadores:

    Processor: Processor Time

    Memory: Available MB

    PageFile: % in use

    Physical Disk: Current Disk Queue Length (da unidade onde estão os dados do SQL)

    Tem antivírus instalado no servidor onde está o SQL Server?

    Verifique o horário quando ocorrer novamente e veja nos logs do Event Viewer de Application e System o que tem registrado no período de 10 minutos antes e depois.

    Veja como obter outras informações importantes do SQL Server através dos relatórios: http://sqldicas.com.br/dicas/relatorios-do-sql-2008/

    Ficamos no aguardo das respostas pra poder continuar te ajudando.

    Abs!


    Luiz Mercante
    MCITP SQL 2008 | MCTS SQL 2008 | MCTS Windows Apps | MCTS Windows Network | MCP 2003
    sqldicas@outlook.com
    http://sqldicas.com.br


    Se a resposta foi útil de alguma forma, classifique.


    segunda-feira, 29 de abril de 2013 00:42
    Moderador
  • Marcos,

    O login é realizado normalmente, o problema ocorre depois de algum tempo trabalhando na aplicação. O problema é que esse tempo varia muito. Não domino muito sobre configurações de rede ou do sql server, mas o administrador da rede disse que as perdas de pacotes são mínimas, ele deixou um ping -t por várias horas e a resposta foi essa:

    4598 packets transmitted, 4598 received, +2 duplicates, 0% packet loss, time 6022285ms

    No event viewer não localizei nenhum erro referente ao Sql, a aplicação ou a rede. Tem erros referente a licença de terminal service, mas acho que isso não influencia pois este servidor é utilizado para conexões de TS apenas pelos administradores.

    Grato,
    Paulo


    segunda-feira, 29 de abril de 2013 12:06
  • Luiz,

    Vou estudar sobre estes contadores e depois retorno.

    Grato,
    Paulo

    segunda-feira, 29 de abril de 2013 12:08
  • Luiz,

    O aplicativo gera log de erros em txt e a maioria dos erros é: "Erro: Falha de conexão",

    algumas vezes aparece: "Socket Error # 10060", "ConnectionWrite (send()).]Erro geral de rede. Verifique a documentação da rede.", "Socket Error # 10061", mas esses são minoria, coisa de 5% dos erros.

    Grato,
    Paulo

    segunda-feira, 29 de abril de 2013 12:17
  • Luiz,

    O aplicativo gera log de erros em txt e a maioria dos erros é: "Erro: Falha de conexão",

    algumas vezes aparece: "Socket Error # 10060", "ConnectionWrite (send()).]Erro geral de rede. Verifique a documentação da rede.", "Socket Error # 10061", mas esses são minoria, coisa de 5% dos erros.

    Grato,
    Paulo

    Boa tarde Paulo.

    Vamos aguardar os dados e te ajudamos a analisá-los. Pode também acontecer de neste período o SQL estar lento, e a configuração de timeout estar muito baixa, já verificou isso?

    Você tem alguma limitação na quantidade de conexões?

    Ficamos no aguardo de todas as informações, abs!


    Luiz Mercante
    MCITP SQL 2008 | MCTS SQL 2008 | MCTS Windows Apps | MCTS Windows Network | MCP 2003
    sqldicas@outlook.com
    http://sqldicas.com.br


    Se a resposta foi útil de alguma forma, classifique.

    segunda-feira, 29 de abril de 2013 20:58
    Moderador
  • Bom Dia Luiz!

    Estas configurações são definidas na ferramenta Microsoft SQL Server Management Studio acessando as propriedades do servidor?

    Se for, o número de conexões simultâneas está igual a 0 e o tempo limite de consulta remota está igual a 600.

    Ontem não teve quedas pra poder avaliar, mas é dessa forma, tem dias que opera 100% sem quedas e outros dias cai várias vezes.

    Grato,
    Paulo

    terça-feira, 30 de abril de 2013 12:39
  • Boa Tarde!

    Ainda não tive registros de queda hoje, referente aos contadores, comecei a monitorar ontem de manhã e o processador não foi utilizado mais que 20% e não teve menos que 5GB de memória livre. Acho que por causa do feriado o movimento está fraco, vou aguardar retornar as ocorrências pra tentar avaliar os gráficos.

    Grato,
    Paulo

    terça-feira, 30 de abril de 2013 18:24
  • Valeu Paulo, o importante é estar coletando os dados. Você pode configurar o perfmon para manter 600 segundos, o que vai ajudar bastante. Estamos esperando a desgraça... rs

    Luiz Mercante
    MCITP SQL 2008 | MCTS SQL 2008 | MCTS Windows Apps | MCTS Windows Network | MCP 2003
    sqldicas@outlook.com
    http://sqldicas.com.br


    Se a resposta foi útil de alguma forma, classifique.

    quarta-feira, 1 de maio de 2013 00:34
    Moderador
  • Boa Tarde!

    Aconteceu a queda em uma das estações hoje às 10:19.

    Segue o gráfico da CPU, memória e disco: https://docs.google.com/file/d/0BxVfg83ssQ73U3ZCY2ZiaUt5eUE/edit?pli=1

    e o gráfico do sql: https://docs.google.com/file/d/0BxVfg83ssQ73LUJKMjJGelo4VTA/edit?pli=1

    Se não conseguir visualizar as imagens me dá uma dica de como postar, pois sou meio novato neste esquema de fórum.

    Percebi muita utilização de disco no momento da queda, mas não compreendi muito bem por causa da escala, será que estava utilizando 100% dos recursos de leitura de disco?

    Grato,
    Paulo



    • Editado PauloSph quinta-feira, 2 de maio de 2013 17:17
    quinta-feira, 2 de maio de 2013 17:13
  • Boa Tarde!

    Aconteceu a queda em uma das estações hoje às 10:19.

    Segue o gráfico da CPU, memória e disco: https://docs.google.com/file/d/0BxVfg83ssQ73U3ZCY2ZiaUt5eUE/edit?pli=1

    e o gráfico do sql: https://docs.google.com/file/d/0BxVfg83ssQ73LUJKMjJGelo4VTA/edit?pli=1

    Se não conseguir visualizar as imagens me dá uma dica de como postar, pois sou meio novato neste esquema de fórum.

    Percebi muita utilização de disco no momento da queda, mas não compreendi muito bem por causa da escala, será que estava utilizando 100% dos recursos de leitura de disco?

    Grato,
    Paulo



    Paulo, obrigado pelo retorno.

    Vamos ajustar a escala, vai ficar mais fácil de compreender o gráfico:

    Processor: Processor Time (vai de 0 a 100% - escala 1,0)

    Memory: Available MB (ajuste pois no seu caso está Available Bytes)

    PageFile: % in use (vai de 0 a 100% - escala 1,0)

    Physical Disk: Current Disk Queue Length (da unidade onde estão os dados do SQL) (coloque escala 1,0)

    Veja através do Page Life Expectancy que uma linha estável indica que as páginas não morrem, ou seja, estão sempre na memória;

    Com o Batch Requests/sec percebemos um aumento muito grande de batches sendo executadas naquele período onde o disco deu um baita salto. Possivelmente houve uma carga de dados a partir de um arquivo na mesma unidade, verifique nos jobs e nos logs dos jobs se algum job rodou naquele horário (10:18 a 10:21)

    Chegou a verificar nos logs do Event Viewer algum evento (info, warning ou error) no período?

    Tem antivírus instalado neste servidor?

    Somente uma estação recebeu o erro? Analisou o Event Viewer da estação no período?

    Deixa o servidor pingando uma máquina do outro prédio pra descartarmos possíveis problemas de conectividade (ping -t).

    Fico no aguardo dos resultados, abs!


    Luiz Mercante
    MCITP SQL 2008 | MCTS SQL 2008 | MCTS Windows Apps | MCTS Windows Network | MCP 2003
    sqldicas@outlook.com
    http://sqldicas.com.br


    Se a resposta foi útil de alguma forma, classifique.

    quinta-feira, 2 de maio de 2013 21:49
    Moderador
  • Bom Dia Luiz!

    Segue o link do gráfico com as escalas ajustadas, ficou faltando apenas a memória.
    https://docs.google.com/file/d/0BxVfg83ssQ73LXpneFJ1TVdsT0U/edit

    As páginas ficarem sempre na memória é um comportamento ruim?

    Tem apenas um job agendado para 02hrs da manhã, naquele horário não rodou nada.

    No Event Viewer do servidor tem apenas um info às 10hrs: “Um processo de trabalho com a identificação '3852', que atende ao pool de aplicativos 'DefaultAppPool', foi encerrado devido à inatividade. A configuração de tempo limite do Pool de Aplicativos foi definida para 20 minutos. Um novo processo de trabalho será iniciado quando necessário.” E às 10:23 informando que o serviço de Relatórios de Erro do Windows entrou no estado interrompido, foi o momento que pausei pra visualizar o gráfico.

    Este evento '3852' já pesquisei, e pelo que entendi está relacionado ao IIS e quando for necessário ele inicia automaticamente.

    O servidor ainda não possui antivírus, é um servidor novo, este sistema entrou em produção a um mês +/- e deste que iniciou ocorre estes eventos de queda.

    Foi apenas esta estação que teve queda neste momento e nada também no Event Viewer dela.

    Quanto aos pings, vou negociar com a equipe de rede, pois é bloqueado por quantidade.

    Pelo jeito acho que isso está relacionado com a rede, pois o servidor é novo, possui 16GB de memória, sempre que acesso o gerenciador de tarefas, ele nunca tem menos que 5GB livre e o processador não ultrapassa 20% de uso. 

    Grato pela ajuda,
    Paulo

    sexta-feira, 3 de maio de 2013 12:28
  • Bom dia Paulo.

    Não, as páginas ficarem na memória é o melhor comportamento possível. Significa que quando for feita uma query, ao invés de verificar que a página não está em memória, solicitar ao sub sistema de I/O que vai até o disco localizar as páginas que podem ainda estar fragmentadas, aguardar o retorno para então executar e entregar o resultado, já pega na memória os dados, processa e entrega. Este é um contador que quanto maior, melhor.

    Este evento ID3852 é apenas que o processo do DefaultAppPool foi encerrado por não estar sendo utilizado, normal.

    É muito difícil relacionar o problema a rede pois geralmente a aplicação trata pequenas perdas de pacote. É uma aplicação Web ou instalada na estação de trabalho?

    Só pra confirmar, no Event Viewer você olhou tanto os logs de aplicação quanto de sistema?

    Quantos usuários estão utilizando a aplicação?

    Assim com poucos detalhes é um tanto difícil de ajudar e todo o troubleshooting básico já fizemos. Seria muito bacana se você conseguir passar pra gente qual foi a causa quando descobrir.

    Espero ter ajudado, abs!


    Luiz Mercante
    MCITP SQL 2008 | MCTS SQL 2008 | MCTS Windows Apps | MCTS Windows Network | MCP 2003
    sqldicas@outlook.com
    http://sqldicas.com.br


    Se a resposta foi útil de alguma forma, classifique.

    sexta-feira, 3 de maio de 2013 15:31
    Moderador
  • Boa tarde Luiz.

    Referente ao Event Viewer, olhei os dois, de aplicação e sistema.

    É uma aplicação desktop, instalada na estação de trabalho, com +/- 15 usuários. O que está incomodando é que é um local de atendimento ao público e a aplicação cair na hora de um cadastro por exemplo, é meio constrangedor. 

    Com certeza se descobrir vou informar a causa e agradeço pelo esforço e tempo dedicado.

    Grato,
    Paulo

    sexta-feira, 3 de maio de 2013 16:20
  • Boa tarde Luiz.

    Referente ao Event Viewer, olhei os dois, de aplicação e sistema.

    É uma aplicação desktop, instalada na estação de trabalho, com +/- 15 usuários. O que está incomodando é que é um local de atendimento ao público e a aplicação cair na hora de um cadastro por exemplo, é meio constrangedor. 

    Com certeza se descobrir vou informar a causa e agradeço pelo esforço e tempo dedicado.

    Grato,
    Paulo

    E aí Paulo, novidades?

    Colabora com o Fórum, conta pra gente como ficou.

    Abs!


    Luiz Mercante
    MCITP SQL 2008 | MCTS SQL 2008 | MCTS Windows Apps | MCTS Windows Network | MCP 2003
    sqldicas@outlook.com
    http://sqldicas.com.br


    Se a resposta foi útil de alguma forma, classifique.

    quinta-feira, 9 de maio de 2013 02:12
    Moderador
  • Bom Dia Luiz!

    Ainda sem novidades, as quedas permanecem, mas continuo na busca da causa, assim que descobrir posto aqui no forum.

    Valeu,
    Paulo

    sexta-feira, 10 de maio de 2013 11:42
  • Bom Dia Luiz!

    Ainda sem novidades, as quedas permanecem, mas continuo na busca da causa, assim que descobrir posto aqui no forum.

    Valeu,
    Paulo

    E aí Paulo, sem novidades?

    Abs!


    Luiz Mercante
    MCITP SQL 2008 | MCTS SQL 2008 | MCTS Windows Apps | MCTS Windows Network | MCP 2003
    sqldicas@outlook.com
    http://sqldicas.com.br


    Se a resposta foi útil de alguma forma, classifique.

    segunda-feira, 20 de maio de 2013 21:36
    Moderador
  • Ainda sem novidades Luiz. O sistema continua perdendo conexão.

    Grato,
    Paulo

    sexta-feira, 24 de maio de 2013 13:56
  • Paulo,

    Há muitos anos tive um problema similar ao seu no Windows Server 2000 e SQL Server 2000, logo após a configuração de um Domínio, algumas estações de trabalho estavam perdendo a conexão com a rede, aparentemente o problema parecia ser no Windows ou no SQL Server, mas na verdade esta no Client Microsoft que estava instalado na máquina.

    Realizamos um monitoramento do consumo de rede em cada estação de trabalho e posteriormente fizemos a troca do Sistema Operacional nas estações em algumas outras atualizamos os drivers das placas e em outros desinstalamos o cliente Microsoft e instalamos novamente.

    Outro problema que observamos estava relacionado com o serviço Horário do Windows que em algumas máquinas estava parando de funcionar.


    Pedro Antonio Galvão Junior [MVP | Microsoft Evangelist | Microsoft Partner | Engenheiro de Softwares | Especialista em Banco de Dados | SorBR.Net | Professor Universitário | MSIT.com]

    sexta-feira, 31 de maio de 2013 01:41
    Moderador
  • Ainda sem novidades Luiz. O sistema continua perdendo conexão.

    Grato,
    Paulo

    Caro Paulo, ainda sem novidades?

    Vamos matar este assunto, tem outros testes que podemos fazer.

    Abs


    Luiz Mercante
    MCITP SQL 2008 | MCTS SQL 2008 | MCTS Windows Apps | MCTS Windows Network | MCP 2003
    sqldicas@outlook.com
    http://sqldicas.com.br


    Se a resposta foi útil de alguma forma, classifique como resposta ou vote como útil.

    domingo, 9 de junho de 2013 23:07
    Moderador
  • Boa Tarde Luiz!

    Semana passada mudamos o servidor de sala, ele estava em um local provisório porque a sala estava em reforma (o sistema foi implantado nesta sala provisória), e desde então não ocorreu quedas, não sei se era o cabeamento de rede do local que ele estava, pois não estava direto no rack, mas também fiquei pensando, se for rede, não era pra dar perda de pacote ping? monitorei por muito tempo e o ping ficou 100%. Mas em todo caso fico torcendo pra ficar resolvido.

    Muito Obrigado pelas dicas!

    Grato,
    Paulo

    quarta-feira, 12 de junho de 2013 18:01