none
Hyper-v 클러스터 호스트머신의 블루스크린 발생 RRS feed

  • 질문

  • 안녕하세요, 
    저희는 hyper-v를 이용하여 현재 클라우드 서비스를 제공하고 있습니다.

    OS는 windows server 2019 datacenter이며, 7개의 hyper-v서버가 하나의 클러스터로 묶여 구성되어있는 형태의 인프라입니다.

    해당 이슈는 처음 발생되어 문의드립니다.

    클러스터 내 특정 호스트머신에 속한 vm이 디도스 공격을 받아 해당 호스트머신의 업링크 커넥션이 끊겼다 붙었다를 반복하며 불안정하다가 해당 호스트머신의 vm들이 전부 다른 호스트머신들로 라이브 마이그레이션 되었고,
    그 후 다른 한 호스트머신에서 블루스크린 및 리부팅이 발생하여 하단의 vm들이 전부 리부팅이 되었습니다.

    마이그레이션 발생 전 공격받은 vm의 호스트머신 이벤트 로그는 다음과 같습니다.
    cluster node 'clustername' was removed form the active failover cluster membership.The cluster service on this node may have stopped.This could also be due to the node having lost communication with other active nodes in the failover cluster. ~~~


    마이그레이션 후 블루스크린이 발생한 호스트머신의 이벤트 로그는 다음과 같습니다.
    Hyper-V VmSwitch event id 113
    failed to allocate vmq for nic maximum number of vmqs supported on the protocol nic is exceeded.

    블루스크린 및 리부팅 후 메모리 덤프 파일 분석 결과내용
    BUGCHECK_CODE:  9e
    BUGCHECK_P1: ffff9705e2836740
    BUGCHECK_P2: 4b0
    BUGCHECK_P3: 7
    BUGCHECK_P4: 0
    PROCESS_NAME:  clussvc.exe
    IMAGE_NAME:  clussvc.exe
    MODULE_NAME: clussvc
    FAILURE_BUCKET_ID:  0x9E_7_IMAGE_clussvc.exe
    FAILURE_ID_HASH:  {0d3348f3-7b29-e3de-982b-b822b8beedd2}
    Followup:     MachineOwner

    해당 이슈가 재발되지 않도록 조치하려고합니다.
    블루스크린 발생원인과 조치 방안 안내 부탁드립니다.



    • 편집됨 rlathwls 2021년 2월 18일 목요일 오전 8:40
    2021년 2월 18일 목요일 오전 12:23

답변

  • 안녕하세요!

    추가 문의 하신 내용에 대한 답변 드립니다.

    NumberOfReceiveQueues 값은 maximum number of vmqs 의미하는 값이 맞습니다.

    기준은 MaxProcessors 값으로 산정 됩니다.

    따라서 표시 되는 NumberOfReceiveQueues 값은 vmqs 가 사용 중인 실제 카운트로 이해 하시면 되겠습니다.

    [참고 링크]

    Sets the VMQ properties of a network adapter

    -MaxProcessors
    Specifies the maximum number of processors used by VMQ for load balancing network transmissions.

    • 답변으로 표시됨 rlathwls 2021년 3월 2일 화요일 오전 5:46
    2021년 2월 22일 월요일 오전 1:34

모든 응답

  • 안녕하세요!

    문의 하신 내용 답변 드립니다.

    블루스크린의 원인은 다음 오류로 인한 내용으로 판단 됩니다.

    Hyper-V VmSwitch event id 113
    failed to allocate vmq for nic maximum number of vmqs supported on the protocol nic is exceeded.

    호스트 머신에서 다음 화면과 같이 물리적 랜 카드 속성에서 

    가상 컴퓨터 큐 항목을 사용안함으로 변경해 보세요.

    • 답변으로 제안됨 lilycao 2021년 2월 19일 금요일 오전 1:27
    • 답변으로 표시됨 rlathwls 2021년 2월 19일 금요일 오전 7:10
    • 답변으로 표시 취소됨 rlathwls 2021년 2월 19일 금요일 오전 7:17
    2021년 2월 18일 목요일 오전 8:52

  • 친절한 답변 감사드립니다.


    ※ 응답이 문제 해결에 도움이 되었다면 [답변으로 표시] 버튼을 눌러 주시기 바랍니다. 이는 유사한 증상을 겪는 다른 사용자들에게 도움이 될 수 있습니다. 만약 TechNet 구독자 지원에 대한 의견이 있다면, tnsf@microsoft.com으로 문의할 수 있습니다.

    2021년 2월 19일 금요일 오전 1:28
  • 혹시 사용안함으로 설정하지않고, 사용으로 설정했을때

    Get-NetAdapterVmq 로 조회되는 NumberOfReceiveQueues 값을 수정해주려면 어떻게 해야하나요?

    같은 네트워크 어댑터를 사용하는 두 서버의 값이 달라서 맞춰주려고합니다. 

    하나는 31 하나는 63입니다.

    아래 에러로그에서 maximum number of vmqs 가 의미하는 값이

    혹시 NumberOfReceiveQueues 인지도 답변 부탁드립니다.

    Hyper-V VmSwitch event id 113
    failed to allocate vmq for nic maximum number of vmqs supported on the protocol nic is exceeded.

    2021년 2월 19일 금요일 오전 7:15
  • 안녕하세요!

    추가 문의 하신 내용에 대한 답변 드립니다.

    NumberOfReceiveQueues 값은 maximum number of vmqs 의미하는 값이 맞습니다.

    기준은 MaxProcessors 값으로 산정 됩니다.

    따라서 표시 되는 NumberOfReceiveQueues 값은 vmqs 가 사용 중인 실제 카운트로 이해 하시면 되겠습니다.

    [참고 링크]

    Sets the VMQ properties of a network adapter

    -MaxProcessors
    Specifies the maximum number of processors used by VMQ for load balancing network transmissions.

    • 답변으로 표시됨 rlathwls 2021년 3월 2일 화요일 오전 5:46
    2021년 2월 22일 월요일 오전 1:34