none
Кластеризованный диск (Cluster Shared Volume) перестал переходить в online. 1069 - Cluster resource 'Cluster Disk 7' in clustered service or application '...' failed. RRS feed

  • Вопрос

  • В кластере вышел из строя один из двух Fiber Channel контроллеров в общем хранилище (HP MSA2312fc), но второй работает и все Vdisks как и Volume на каждом из них видны и вроде полностью работоспособны. Кластер видит все Cluster Shared Volume и все работают, кроме одного - почему-то он не хочет переходить в онлайн ни на одной из 4-х нод кластера. В чём может быть причина и как бы его в онлайн поднять? Или это всё же проблема с "железом", с MPIO? Смотрел в HP Storage Management Utility - все Volume, включая тот, который не может перейти в online, настроены на оба канала. Как бы хотя бы проверить с железом проблема или с софтом? Может вывести из кластера этот диск? 3-летняя гарантия на "железо" совсем недавно закончилась и замена умершей железке будет не быстро получена.

    P.S. Windows Server 2008 R2 Enterprise Eng со всеми апдейтами.

    4 марта 2013 г. 8:32

Ответы

  • В общем сделал я Remove from Cluster Shared Volumes, затем под админом запустил Power Shell и там Import-Module FailoverClusters, затем Clear-ClusterDiskReservation -disk 7, после чего на ноде-owner-е в Failover Cluster Manager-е удалось поднять этот диск в online, после чего я этот диск обратно в кластер загнал и тогда виртуальные машины поднялись.

    > Попробовать вы можете, но это не решит проблему как таковую. Возможно сейчас вы оживите этот диск. Но с большой вероятностью он "отвалится" снова.

    Пока всё работает, пользователи рады, работа продолжается. Надеюсь что не отвалится, что эта проблема никак не связана с "железом", хотя может и явилась следствием аппаратного сбоя FC-контроллера.

    • Помечено в качестве ответа Denis DyagilevEditor 5 марта 2013 г. 12:40
    5 марта 2013 г. 12:26

Все ответы

  • Для начала находим последнюю ноду-координатор этого диска. Перезагружаем. Находим проблемный диск в Disk Management и делаем ему online и, если вышел в онлайн, сразу offline. Заходим в Failover Cluster Manager и делаем для CSV bring online.

    http://OpsMgr.ru/

    4 марта 2013 г. 9:22
    Отвечающий
  • Не совсем понял о чём речь. Перезагружаем ноду owner проблемного диска? Но тогда другая нода становится owner-ом. Обратно муваем? В Disk Management-е он как и был - reserved (и не доступен одинаково на всех нодах, в отличие от беспроблемных кластерных дисков) и нет возможность ни на что (online) нажимать. Или я что-то не понимаю?
    4 марта 2013 г. 11:22
  • Проверяем установлено ли это: http://support.microsoft.com/kb/2687646

    >Перезагружаем ноду owner проблемного диска?

    Да. Крайне желательно ту ноду, которая была владельцем именно в момент отключения диска.

    >Обратно муваем?

    Не обязательно.

    >В Disk Management-е он как и был - reserved (и не доступен одинаково на всех нодах, в отличие от беспроблемных кластерных дисков) и нет возможность ни на что (online) нажимать.

    Попробуйте перезагрузить все ноды по очереди и смотреть даст ли Disk Management вывести диск в онлайн.

    Если этот "быстрый" способ не поможет, вам нужно заводить кейс в НР либо вызывать их инженера. Там достаточно много мест, где это может быть сломано.


    http://OpsMgr.ru/

    4 марта 2013 г. 14:57
    Отвечающий
  • Проверяем установлено ли это: http://support.microsoft.com/kb/2687646


    Эта штука не стоит, сейчас буду ставить, проверять, спасибо.


    > Да. Крайне желательно ту ноду, которая была владельцем именно в момент отключения диска.

    Кто ж её знает, всё сломалось на выходных, диски иногда почему-то сами переезжают с ноды на ноду да и я их уже мувал туда-сюда.

    > Попробуйте перезагрузить все ноды по очереди и смотреть даст ли Disk Management вывести диск в онлайн.

    Поставлю на всех нодах этот фикс и попробую.

    > Если этот "быстрый" способ не поможет, вам нужно заводить кейс в НР либо вызывать их инженера. Там достаточно много мест, где это может быть сломано

    А что на счёт Clear-ClusterDiskReservation? Стоит его попробовать? А такой шаманизм как вывести этот диск из кластера (Remove from Cluster Shared Volumes) и обратно подключить - ничего не сломает?

    5 марта 2013 г. 5:31
  • >А что на счёт Clear-ClusterDiskReservation? Стоит его попробовать? А такой шаманизм как вывести этот диск из кластера (Remove from Cluster Shared Volumes) и обратно подключить - ничего не сломает?

    Попробовать вы можете, но это не решит проблему как таковую. Возможно сейчас вы оживите этот диск. Но с большой вероятностью он "отвалится" снова.


    http://OpsMgr.ru/

    5 марта 2013 г. 9:08
    Отвечающий
  • Фикс и перезагрузки ни к чему не привели, всё как и было.
    5 марта 2013 г. 11:26
  • В общем сделал я Remove from Cluster Shared Volumes, затем под админом запустил Power Shell и там Import-Module FailoverClusters, затем Clear-ClusterDiskReservation -disk 7, после чего на ноде-owner-е в Failover Cluster Manager-е удалось поднять этот диск в online, после чего я этот диск обратно в кластер загнал и тогда виртуальные машины поднялись.

    > Попробовать вы можете, но это не решит проблему как таковую. Возможно сейчас вы оживите этот диск. Но с большой вероятностью он "отвалится" снова.

    Пока всё работает, пользователи рады, работа продолжается. Надеюсь что не отвалится, что эта проблема никак не связана с "железом", хотя может и явилась следствием аппаратного сбоя FC-контроллера.

    • Помечено в качестве ответа Denis DyagilevEditor 5 марта 2013 г. 12:40
    5 марта 2013 г. 12:26