none
Проблемы в работе HPC сервера 2008 после миграции из одного домена в другой. RRS feed

  • Общие обсуждения

  • Добрый вечер.

    Прошу помощи у знатоков HPC PACK.

    Пред история:

    Был сервер на Server HPC 2008 и установленным на нем HPC PACK 2008 R2. Выполнял задачи расчетного сервера под определенное ПО.

    Потом произошла миграция в другой домен со сменой IP адреса.  После этого подключение к HPC PACK стало не возможно, тк HPC где запомнил старый IP адрес. Поменять IP не могу на старый тк другая сеть.

    18 декабря 2012 г. 13:12

Все ответы

  • А переустанавливать HPC Pack не пробовали на головной ноде?

    18 декабря 2012 г. 13:20
  • Не пытался, тк не знаю как сделать экспорт настроек.
    18 декабря 2012 г. 13:58
  • Не пытался, тк не знаю как сделать экспорт настроек.

    Если доступен HPC Cluster Manager:

    1. Configuration -> Network -> Save Report (текстовый файл топологии кластерной сети)
    2. Нужно знать логин/пароль HPC-администратора, от имени которого работает HPC-Pack (обычно - администратор домена)
    3. Если в шаблонах узлов есть какие-то настройки:  Configuration ->  Node Templates -> Export (xml-файл настроек для каждого шаблона)
    4. Нужно знать, как называются узлы кластера (node-1, node-2 или  n-1, n2 и т.п. )
    5. Если для развертки требуются какие-то образы, их wim'ы можно посмотреть здесь:  Configuration -> Network -> Images (для уже развернутых узлов - совсем не нужно, да и для неразвернутых, не особо, если их не более 10-15)
    6. Все шаблоны заданий находятся здесь:  Configuration -> Job Templates, их тоже можно экспортировать  (xml-файл настроек для каждого шаблона)
    7. Список и роли пользователей:  Configuration -> Users (запомнить/записать, чтобы потом восстановить)

    Собственно, это все настройки. 

    После установки следует пройтись по 4-м пунктам списка To-do, восстановив все исходные (вышеперечисленные) настройки и провести общий тест в Diagnostics (Validate your cluster)

    Если  HPC Cluster Manager недоступен, то пройдитесь по пунктам и ответьте на те вопросы, какие сможете.

    19 декабря 2012 г. 5:45
  • Сегодня попробую.

    Не могу выложить скриншоты.

    http://narod.ru/disk/64618014001.1e8979335d6fbf00d6dd4e52e6546584/Version_HPC_PACK_2008.png.html

    http://narod.ru/disk/64618004001.c8f6ead53483dd99d0aa1893cc7d355c/%D0%9E%D1%88%D0%B8%D0%B1%D0%BA%D0%B0.png.html

    http://narod.ru/disk/64617986001.cc74a97d09443e4f2205b3448554b502/users.png.html

    1. 

    --------------------------------------
    Topology: Topology 5: All nodes only on an enterprise network
    --------------------------------------
    Network Interfaces

    Name: Local Area Connection 2
    Device name: Broadcom BCM5709C NetXtreme II GigE (NDIS VBD Client) #2
    IP address:
    Subnet mask:
    Domain:
    Link speed: 1 Gbps
    Status: Offline
    MAC address: -8E
    Network Direct: False
    Bound to network:

    Name: Enterprise
    Device name: Broadcom BCM5709C NetXtreme II GigE (NDIS VBD Client)
    IP address: 195.0.0.28
    Subnet mask: 255.255.0.0
    Domain:
    Link speed: 1 Gbps
    Status: Online
    MAC address: -8C
    Network Direct: False
    Bound to network: Enterprise
    --------------------------------------
    Enterprise Network

    Device name: Broadcom BCM5709C NetXtreme II GigE (NDIS VBD Client)
    DHCP client: False
    Subnet: 195.0.0.0/255.255.0.0
    Firewall: OFF
    --------------------------------------

    2. Где задается пароль HPC администратора?

    3. http://narod.ru/disk/64618262001.6e49c6a02bb120b02a61f52d4408393c/Node_Templates.png.html

    4. У нас только один мэйнфрейм (24 ядра и memory 128 GB)

    • Изменено V8Roman 19 декабря 2012 г. 12:24
    19 декабря 2012 г. 5:54
  • Прошу прощение за не точные ответы, тк не я занимался его поднятием и настройкой.

    Network Configuration Report
    --------------------------------------

    Network Configuration

    18.12.2012 15:33:00: Interface Binding: Private Network
    Settings: 
    Subnet = 
    DhcpEnabled = False
    NatEnabled = False
    FirewallEnabled = Skipped


    18.12.2012 15:33:00: Remain firewall settings
    Settings: 
    InstanceName = Enterprise
    Subnet = 195.0.0.0/255.255.0.0
    FirewallEnabled = 
    NatEnabled = False
    DhcpEnabled = False
    RegisterWithDnsServer = MachineDomain


    18.12.2012 15:33:00: Interface Binding: Application Network
    Settings: 
    Subnet = 
    DhcpEnabled = False
    NatEnabled = False
    FirewallEnabled = Skipped


    18.12.2012 15:33:45: Topology Selection
    Settings: 
    Topology = Public


    --------------------------------------

    Configuration Logs

    18.12.2012 15:33:22 Error Could not contact node 'Server2013' to perform change. Connection Failed. A connection attempt failed because the connected party did not properly respond after a period of time, or established connection failed because connected host has failed to respond 169.254.79.70:6730
    18.12.2012 15:33:43 Error Could not contact node 'SERVER2013' to perform change. Connection Failed. A connection attempt failed because the connected party did not properly respond after a period of time, or established connection failed because connected host has failed to respond 195.0.0.28:6730
    18.12.2012 15:33:44 Error Could not contact node 'SERVER2013' to perform change. Authentication failed. The server has rejected the client credentials.
    18.12.2012 15:33:44 Error Could not contact node 'SERVER2013' to perform change. Authentication failed. The server has rejected the client credentials.
    18.12.2012 15:33:44 Error Could not contact node 'SERVER2013' to perform change. The management service was unable to connect to the node using any of the IP addresses resolved for the node.
    18.12.2012 15:33:44 Warning Failed to execute the change on the target node
    18.12.2012 15:33:44 Information Reverted
    --------------------------------------
    18.12.2012 15:33:45 Failed to apply change, check the log for details
    --------------------------------------

    • Изменено V8Roman 19 декабря 2012 г. 12:26
    19 декабря 2012 г. 12:25
  • Господа! Прошу помощи! 

    29 января 2013 г. 6:29
  • Господа! Так и не разобрался с проблемой. DHCP сервер должен поднят на HPC?
    4 апреля 2013 г. 13:43
  • Добрый вечер. На сервере застопорена (Disable) служба DHCP сервер.

     Она должна быть запущена, дайте статью как настроить HPC.

    The DHCP/BINL service on the local machine, belonging to the Windows Administrative domain irkut.com, has determined that it is not authorized to start.  It has stopped servicing clients.  The following are some possible reasons for this: 
    This machine is part of a directory service enterprise and is not authorized in the same domain.  (See help on the DHCP Service Management Tool for additional information). 

    This machine cannot reach its directory service enterprise and it has encountered another DHCP service on the network belonging to a directory service enterprise on which the local machine is not authorized. 

    Some unexpected network error occurred.


    4 апреля 2013 г. 13:57