none
Помогите починить кластер Windows 2012 R2 RRS feed

  • Вопрос

  • Имелась следующая конфигурация:

    Serv1 - HP DL 380 G5, Serv2 - HP DL 380G5, СХД - HP P2000 G3

    Двухголовочные FC-карточки серверов (Brocade 425/825) напрямую были подключены к СХД

    Был собран кластер и всё прекрасно работало, пока не появилось желание добавить в кластер еще один сервер (Serv8 - HP DL 380 G5). Были установлены 2 свитча Qlogic и произведено переподключение FC-карточек к СХД через свитчи. И вот тут Serv1 повел себя нетривиально. Зависли все виртуалки, которые выполнялись на нем и запустить теперь виртуалки на нем невозможно. На Serv2 все виртуалки выполняются нормально. Но как только пытаешься перегнать виртуалку на Serv1, виртуалка сначала переезжает на Serv1, а потом виснет намертво. Но самое интересное, что добавленный в кластер Serv8 ведет себя так же как и Serv1 - на нем невозможно создать виртуалки на кластерном ресурсе - C:\ClusterStorage\Volume1. Точнее, оно создается, но жутко тормозит при установке на виртуалку ОС. 

    В журналах ничего интересного нет. Разве что вот:

    Пространство имен root\mscluster помечено флагом RequiresEncryption. В доступе к нему может быть отказано, если сценарий или приложение не прошли проверку подлинности на соответствующем уровне. Измените уровень проверки подлинности на Pkt_Privacy и запустите сценарий или приложение снова.

    Но я исправил это на Serv1 - не помогло. 

    Помогите! куда смотреть и что искать?


     

    4 января 2016 г. 8:26

Ответы

Все ответы

  • Ну, смотреть надо, как всегда, в результаты мастера проверки кластера (или как он там называется в русской версии).

    А искать, наверное, надо проблемы связи по FC между серверами и хранилищем, раз вы там меняли.


    Слава России!

    4 января 2016 г. 9:11
  • Попробуйте так же обновить сервера через Service Pack for Proliant (HP SPP), возможно проблема железная

    The opinion expressed by me is not an official position of Microsoft

    4 января 2016 г. 9:21
    Модератор
  • Обновлял через HP SUM. Один сервер ожил. Как называется компонента для сервера  кластера, которая относится к СХД? Где-то читал, что под каждый тип полки на сервер лучше ставить компоненту именно этой полки. Не смог ничего подобного найти в разделе P2000 g3 на сайте. И не могу теперь найти, где я это прочитал. 
    4 января 2016 г. 12:51
  • Странно всё. Serv1 работал нормально с виртуалками до первой перезагрузки. Потом то же самое. Основной тест - невозможно ничего скачать с общего кластерного ресурса. Хотя ресурс виден. Начинаем качать на максимальной скорости и вдруг - затык и полная остановка.
    4 января 2016 г. 16:49
  • Пробуйте менять патчкорды.

    • Помечено в качестве ответа dima.spb 7 января 2016 г. 14:26
    4 января 2016 г. 19:09
  • Здравствуйте!

    Был случай когда при увеличении нагрузки на P2000 подвисал или перегружался контролер. Иногда просто отваливались часть путей MPIO

    4 января 2016 г. 20:19
  • Да работает, вроде, полка. Один сервер же работает. Еще странную вещь заметил. На серверах, которые работают криво, стоят FC-карточки Qlogic, а на работающем - Brocade. При этом FC-свитчи стоят Qlogic. Qlogic работает криво со своим же оборудованием?
    5 января 2016 г. 11:12
  • Как вариант - некорректная работа полки (они же не идеальны)))) ) проблмы софтоые лечатся перепрошивкой, железные - попытка перезапустить сначала рестартом. а потом отключением, выниманием, вставлением назад, если не ожило - замена/СЦ.

    Второй вариант - по непонятным причинам MPIO не работает как положено. А почему бы и нет, собственно, стоит проверить, что полка действительно доступна по обоим путям, что разные порты на карточках подключены к разным контроллерам, что при переключении эта схема сохраняется (ну так тоже бывает, недавно поехал решать действительно проблему, а заодно махнул патч-коды между контроллерами на одной из полок, потому как оказалось. что каждый контроллер смотрел только в одну фабрику, а должен смотреть в две - ловкость рук при установке, не критично, но вероятность несчастливого стечения обстоятельств не отменяется).

    Кстати о фабриках и свичах - имела ли место настройка хоть какого-нибудь зонинга? Может быть полка просто никому не светит, потому что это не разрешено; правилами жестко должно быть разрешено какие WWN с какими могут общаться, иначе - бардак.

    6 января 2016 г. 20:56
  • Да. Зонинг был настроен следующим образом. К 0 порту свитча подключен первый контроллер полки. К 1 порту свитча подключен второй контроллер полки. 2 порт свитча - 1 порт Serv1, 3 порт свитча - 1 порт Serv2, 4 порт свитча - 1 порт Serv8.

    Второй свитч подключен симметрично другими портами контроллеров полки и серверов.

    На обоих свитчах были настроены зоны между портами:

    0-2, 0-3, 0-4, 1-2, 1-3, 1-4

    В соответствии с этим, каждый сервер видит 4 пути к полке - у всех всё одинаково  в свойствах дисков на вкладке "многопутевой ввод-вывод". 

    К сожалению, пока нет физического доступа к этому хозяйству. Но думаю, что проблема все же софтверная. Я уже упоминал, что поле одного из накатываний обновлений с помощью HP SUM один из серверов вдруг заработал нормально. Но это было до первой перезагрузке.  Только не понятно как теперь понять, что там поставилось. HP SUM не помогает.

    7 января 2016 г. 7:48
  • Антон петров - колдун, однако! :) Сегодня удалось добраться до железяк. Отключил метровые патчкорды, подключил трехметровые. Все заработало. Подключил обратно метровые. Перегружал и так и сяк - все равно работает. Ну как в оптике могут быть "плохие контакты"? Это же не электрика! 
    7 января 2016 г. 14:28
  • просто был уже такой опыт
    7 января 2016 г. 18:24