none
Operations Manager failed to run a WMI query for WMI events RRS feed

全部回复

  • Hi Carson,
     
    这个警告表示SCOM在运行WMI query的时候,node在pause状态或者在重启状态。我们可以尝试以下步骤做进一步分析:。
    1. 检查resource group是否online。
    2. 使用执行Cluster monitor的action account到警告产生的机器上去运行WMI query,执行语句“SELECT Name, State FROM MSCLUSTER_ResourceGroup”,看是否可以正确返回结果。
    3. 查看cluster 相关日志,看在警告产生时间点左右有没有active node, passive node重启,或者网络相关问题产生。
    4. 查看这个警告产生的时间是否是有规律的、不间断的。
     
    请检查以上信息,以方便我们来做进一步排查。
     
    Best regards.
    Crystal.

    Please remember to mark the replies as answers if they help.
    If you have feedback for TechNet Subscriber Support, contact tnmff@microsoft.com.

    2020年1月14日 8:37
  • Hi Crystal,

    1.“SELECT Name, State FROM MSCLUSTER_ResourceGroup”该语句应该是在SQL上查询吧?

    2.该报错在我SCOM服务器本身上应该不用排错吧?印象中没有设置过与WMI相关的设置

    3.为什么会出现WMI query呢,系统做这个事情有什么作用呢,想了解下。

    4.是否可以禁用该警报?

    Thanks!

    2020年1月14日 8:59
  • Hi Carson,
     
    1.“SELECT Name, State FROM MSCLUSTER_ResourceGroup”该语句应该是在SQL上查询吧?
    这个是WMI语句,是需要用WMI 查询工具运行的,自带的有wbemtest,具体查询您可以参考以下文章:

    https://kb.netapp.com/app/answers/answer_view/a_id/1033398/~/how-to-test-wmi-queries-using-built-in-windows-tools-

    Note: 非微软文章,仅供参考。
     
    2.该报错在我SCOM服务器本身上应该不用排错吧?印象中没有设置过与WMI相关的设置
    这个报警应该是您导入的SQL或者Cluster相关的MP包里的rule/monitor产生的,和server 应该没什么关系。具体您可以看一下这个Alert 的Details, 看一下是哪个rule/monitor产生的,它是在哪个MP包里的。
     
    3.为什么会出现WMI query呢,系统做这个事情有什么作用呢,想了解下。
    从WMI查询语句来看,它是用来查看Cluster的resource group状态的。要进一步确认的话,需要您先帮忙确认这个Alert 产生的rule/monitor是哪个,在哪个MP下。
     
    4.是否可以禁用该警报?
    如果产生警告时,您的resource group都是online 健康的话,我们可以考虑override去禁用这个rule。
     
    希望以上信息对您有帮助,祝您工作愉快。
     
    Best regards.
    Crystal

    Please remember to mark the replies as answers if they help.
    If you have feedback for TechNet Subscriber Support, contact tnmff@microsoft.com.

    2020年1月15日 6:21
  • Hi Carson,

    请问您对我们之前的回复有什么疑问吗?或者还有什么我们可以帮助的地方吗?如果有,请告知。

    Best regards.

    Crystal


    Please remember to mark the replies as answers if they help.
    If you have feedback for TechNet Subscriber Support, contact tnmff@microsoft.com.

    2020年1月21日 7:00
  • Hi Crystal,

    不好意思,久等了!

    已查到是一个规则监控, 如下图,帮忙看下有没有什么解决方案。谢谢!

    2020年1月22日 4:35
  • 您好!
     
    这个规则,我查了下, 一般MP中运行WMI query都会用到这个规则。详细信息如下:

    https://systemcenter.wiki/?GetElement=Microsoft.SystemCenter.WmiEventModule.FailedExecution.Alert&Type=Rule&ManagementPack=Microsoft.SystemCenter.2007&Version=10.19.10050.0

    提示:非微软文章,仅供参考。
     
    请问您被监控的机器是什么版本的,我看到有些已知事件和系统没有打上最新补丁有关,建议您把有问题的机器补丁更新到最新。
     
    关于我们的报错“The remote server has been paused or is in the process of being started.“, 有可能是当时环境中active node重启导致的短暂联系不上,以下链接您可以参考下。

    https://support.microsoft.com/en-za/help/822050/cluster-service-stops-responding-on-a-cluster-node-when-you-restart-th

     
    我个人觉得如果这个警告是偶发性,且目前Cluster一切正常,我们可以忽略。如果我是已知产生的,我们可以到monitored 的object上执行WMI 查询做进一步排查。
     
    希望以上信息对您有帮助,祝您工作愉快。
     
    Best regards.
    Crystal

    Please remember to mark the replies as answers if they help.
    If you have feedback for TechNet Subscriber Support, contact tnmff@microsoft.com.

    2020年1月22日 6:11
  • 我们环境的操作系统是windows server 2012 R2和2016这二个版本。

    windows 安全补丁应该是最新的,因为经常有下载安装补丁的,我们也有Wsus server.

    请问这个alert rule是否建议禁用比较好呢?cluster环境也是没问题的,只是有些时候机器会重启,因为要完成安装补丁。

    Thanks!

    2020年1月22日 6:49
  • 您好!
     
    如果您cluster环境机器重启的不频繁,产生 alert 不是很多的话,我们建议您忽略这些警告,如果比较频繁,产生 alert 比较多的话,您可以override这个rule ,在这几个node 上禁用。您可以根据自己的情况来设置。
     
    Best regards.
    Crystal

    Please remember to mark the replies as answers if they help.
    If you have feedback for TechNet Subscriber Support, contact tnmff@microsoft.com

    2020年1月23日 5:55