none
Perda de comunicação com os discos na CSV RRS feed

  • Pergunta

  • Olá.

     

    Pessoal, estamos com um problema em um ambiente Microsoft/HP e gostaria de saber se alguém já passou por algo parecido e como solucionou.

     

    Cenário: Cliente possui 12 Servidores Blade com Win2008R2 c/ SP1 juntamente a um Cluster Hyper-V. O armazenamento é realizado em um Storage HP EVA (Replicado). O sistema de discos das máquinas virtuais é disponibilizado através do recurso CSV.

     

    Problema: Hoje no período da tarde parou praticamente todos os acessos as máquinas virtuais. Os servidores Host disponibilizavam acesso, mas a comunicação com as máquinas virtuais foi interrompida. Tivemos que realizar o reinício de lâmina por lâmina para as VM´s voltarem. Verificado que o evento gerado nos servidores Host indicam que houve perda na comunicação com os discos CSV, mas ao acessar os Hosts tinha-se acesso 100% aos discos em C:\ClusterStorage\.

    Erro:

     ID 20100 - Falha do serviço Gerenciamento de Máquinas Virtuais ao registrar a configuração da máquina virtual "81XXXXXX" em C:\ClusterStorage\volume7\servidor: Erro geral de acesso negado.

    ID 5120 - O Volume Compartilhado de Cluster "Volume4" (Disco de Cluster 5) não está mais disponível neste nó devido a 'STATUS_CONNECTION_DISCONNECTED(c000020c)'. Todo E/S será colocada temporariamente em fila até que um caminho para o volume seja restabelecido.

     

    OBS: O Ambiente possui um cluster SQL em outras 02 máquinas e não ocorreu nenhum problema. Verificado nos Storages e não encontrado nenhum evento que mostra-se algum problema.

     

    Caso alguém já passou por isso e quer expor sua experiência ou já ouviu falar sobre este erro, agradeço.

     

    Abraços!

    terça-feira, 5 de julho de 2011 03:12

Respostas

  • Olá Andre,

    Eu não conheço como funcionao o Team HP por isso não posso te dizer sobre. Temos que estudar um pouco sobre o funcionamento dele.

    O problema nesse caso não é o direcionamento do CSV e sim da perda de comunicação. O CSV é apenas o compartilhamento de uma área de espaço onde vários host pode acessar e o mesmo é configurado nos host, então quando um host perde a comunicação outro host não perde, a não ser que seja um problema no armazenamento (Storage).

    Temos que verificar se existe algum log no servidor ou na sua Storage, para conseguirmos chegar ao problema.

    Você consegue pela console da Storage pegar um log de como está o funcionamento de IO de rede ?

    E tente pegar também um log de IO de disco, que já nos ajuda a ter uma noção de como está.

    Caso os logs de Rede e Disco mostrarem um cenário tranquilo de funcionamento, partiremos para outro ponto.

    O Team HP está configurado nos Host's Hyper-V ?

    Tente extrair os logs para chegarmos ao problema.

    Aguardo seu contato.

     

    Caso exista alguma atualização de status do seu problema posta ai pra te ajudar!

     

    Grande abraço


    http://virtualizing.wordpress.com/
    terça-feira, 5 de julho de 2011 17:32
  • Bom,

    Segundo documentações (e uma dica do Kolarik), não é recomendado o uso de TEAM e sim o MPIO.

    Eu usava esse TEAM da HP para conectar ao Storage, mas sempre tive problemas. Troquei para o MPIO e realmente ficou 100%.


    Se foi útil marca como resposta! _________________________________________________ Rafael Bernardes - It Hero 2009 Award Microsoft Certified Technology Specialist rafael@bernardes.org http://blog.bernardes.org 21 8162-3956 21 7894-5536
    quarta-feira, 6 de julho de 2011 23:45

Todas as Respostas

  • Olá André,

    Vou te passar algumas dicas que podem te ajudar:

    1 - Abra o snap-in do failover cluster e execute ele como administrador clicando com o botão direito e run as administrator

    2 - Quando você abrir o Failover cluster e ele não estiver sendo visualizado, clique com o botão direito em Failover cluster manager e clique em Manage a Cluster e digite/selecione o cluster que você deseja gerenciar.

    3 - expanda a árvore do cluster e clique em cluster shared volumes.

    4 - no painel central expanda a lista de volumes e veja como está o status

    5 - caso exista algum volume que esteja com o status offlline clique com o botão direito e selecione a opção Bring this resource online.

    _________________________________________________________________________________________________________________________________________

    1 - Veja se na placa de rede os seguintes protocolos estão ativos:

  •      Client for Microsoft Networks
  •      File and Printer Sharing for Microsoft Networks
  • _________________________________________________________________________________________________________________________________________

    E como ultima solução tente fazer o CSV novamente desmontando os volumes e refazendo.

    Existe alguma coisa em sua rede que possa estar gerando tráfego além do normal ? Tipo um tráfego GB  que possa influênciar no IO das Networks?

    Aguardo sua resposta para continuar te ajudando.

    Grande abraço


  • http://virtualizing.wordpress.com/
terça-feira, 5 de julho de 2011 03:40
  • Olá, Então cara, o problema é complicado. O que temos, que talvez tenha algo relacionado a este caso é os Hosts rodando com TEAM HP nas placas de rede. Será que tem como eu desabilitar a opção de não direcionar as CSV via rede caso a comunicação com a CSV seja perdida? Talvez isto seja algo relacionado. Sobre a remoção das CSV e readequação das mesma, você diz que iria talvez mudar alguma coisa? Abraços e obrigado pela ajuda.
    terça-feira, 5 de julho de 2011 14:28
  • Olá Andre,

    Eu não conheço como funcionao o Team HP por isso não posso te dizer sobre. Temos que estudar um pouco sobre o funcionamento dele.

    O problema nesse caso não é o direcionamento do CSV e sim da perda de comunicação. O CSV é apenas o compartilhamento de uma área de espaço onde vários host pode acessar e o mesmo é configurado nos host, então quando um host perde a comunicação outro host não perde, a não ser que seja um problema no armazenamento (Storage).

    Temos que verificar se existe algum log no servidor ou na sua Storage, para conseguirmos chegar ao problema.

    Você consegue pela console da Storage pegar um log de como está o funcionamento de IO de rede ?

    E tente pegar também um log de IO de disco, que já nos ajuda a ter uma noção de como está.

    Caso os logs de Rede e Disco mostrarem um cenário tranquilo de funcionamento, partiremos para outro ponto.

    O Team HP está configurado nos Host's Hyper-V ?

    Tente extrair os logs para chegarmos ao problema.

    Aguardo seu contato.

     

    Caso exista alguma atualização de status do seu problema posta ai pra te ajudar!

     

    Grande abraço


    http://virtualizing.wordpress.com/
    terça-feira, 5 de julho de 2011 17:32
  • Bom,

    Segundo documentações (e uma dica do Kolarik), não é recomendado o uso de TEAM e sim o MPIO.

    Eu usava esse TEAM da HP para conectar ao Storage, mas sempre tive problemas. Troquei para o MPIO e realmente ficou 100%.


    Se foi útil marca como resposta! _________________________________________________ Rafael Bernardes - It Hero 2009 Award Microsoft Certified Technology Specialist rafael@bernardes.org http://blog.bernardes.org 21 8162-3956 21 7894-5536
    quarta-feira, 6 de julho de 2011 23:45