none
100% загрузки после рестарта HealthService RRS feed

  • Вопрос


  • Уже на двух серверах заметил следующую ситуацию: после перезапуска службы HelathService, загрузка процессора поднимается до 100%, видно что основную загрузку генерять скрипты запускаемы SCOM. Через 5-7 минут скрипты начинают отваливаться по таймауту и загрузка постепенно выходит на стандарный уровень.

    В чем может быть проблема? http://forums.microsoft.com/TechNet-RU/ShowPost.aspx?PostID=1878179&SiteID=40 - видел, но у меня такого файла нет.

    В журнале полно предупреждений:

    Тип события: Предупреждение
    Источник события: Health Service Modules
    Категория события: Отсутствует
    Код события: 21403
    Дата: 24.11.2008
    Время: 12:08:28
    Пользователь: Н/Д
    Компьютер: TAGANDEPT
    Описание:
    Процесс, запущенный в 12:03:28, завершен, так как служба работоспособности запросила остановку рабочего процесса. Некоторые данные могут быть потеряны.

    Выполненная команда: "C:\WINDOWS\system32\cscript.exe" /nologo "NetworkAdapterCheck.vbs" tagandept.office.inprom.ru 1 false true false
    Рабочий каталог: C:\Program Files\System Center Operations Manager 2007\Health Service State\Monitoring Host Temporary Files 3\3200\

    Это затронуло один или несколько рабочих процессов.

    Имя рабочего процесса: Microsoft.Windows.Server.2003.NetworkAdapter.NetworkAdapterConnectionHealth
    Имя экземпляра: Local Area Connection
    ИД экземпляра: {64EB83D5-43A3-12BA-FA4B-D319CB90223E}
    Группа управления: UK

    Дополнительные сведения можно найти в центре справки и поддержки, в "http://go.microsoft.com/fwlink/events.asp".




    24 ноября 2008 г. 9:57

Все ответы

  • Что дает запуск этой строки вручную ?

    "C:\WINDOWS\system32\cscript.exe" /nologo "NetworkAdapterCheck.vbs" tagandept.office.inprom.ru 1 false true false

     

    24 ноября 2008 г. 10:18
    Отвечающий
  • C:\Program Files\System Center Operations Manager 2007\Health Service State\Monitoring Host Temporary Files 4\3200>"c:\windows\system32\cscript.exe" /nologo "NetworkAdapterCheck.vbs" tagandept.office.inprom.ru 1 false true false
    <Collection><DataItem type="System.PropertyBagData" time="2008-11-24T14:18:14.05
    22929+03:00" sourceHealthServiceId="05BC6ABA-02DA-8CA3-53CA-9FF3524D9BBA"><Prope
    rty Name="State" VariantType="8">GOOD</Property></DataItem></Collection>

    Но это данные после перезапуска службы HealthService и WMI. Подозреваю что проблема была, как раз со службой WMI, очень долго не хотела останавливаться, плюс когда пытался выполнить из Powershell такой запрос:
    gwmi Win32_ComputerSystem -ComputerName TAGANDEPT | Select NumberOfProcessors ответом мне было: "Общая ошибка"
    24 ноября 2008 г. 11:37
  • И снова возникли проблемы. При старте службы OpsMgr Heath Service запускаются скрипты, которые отжирают ЦП и память, машина весит почти полностью. В логе OpsMgr на клиенте очен много сообщений 21402, 21403. 

    Хотел выполнить скрипт вручную, но оказалось что все папки  "C:\Program Files\System Center Operations Manager 2007\Health Service State\Monitoring Host Temporary Files 1\ пусты.

    Такое происходит пока только на двух контроллерах домена, все остальные сервера вроде бы работают нормально.

    Сначала фиксируеются эти предупреждения, а потом 21402 и 21403. 

    Тип события: Предупреждение
    Источник события: Health Service ESE Store
    Категория события: Быстродействие 
    Код события: 508
    Дата: 24.11.2008
    Время: 10:18:59
    Пользователь: Н/Д
    Описание:
    HealthService (6100) Health Service Store: Запрос на запись в файл "C:\Program Files\System Center Operations Manager 2007\Health Service State\Health Service Store\edb.log" со смещением 24576 (0x0000000000006000) размером 512 (0x00000200) байт выполнен, но его выполнение ОС заняло слишком много времени (232 секунд). Вероятно, эта ошибка вызвана сбоем оборудования. Обратитесь к поставщику оборудования, чтобы точно установить причину ошибки.
    Дополнительные сведения можно найти в центре справки и поддержки, в "http://go.microsoft.com/fwlink/events.asp".

    Тип события: Предупреждение
    Источник события: Health Service Modules
    Категория события: Отсутствует
    Код события: 10401
    Дата: 24.11.2008
    Время: 10:19:19
    Пользователь: Н/Д
    Описание:
    Модулю не удалось подключиться к пространству имен "\\.\ROOT\CIMV2"
     Это произошло 1 раз с момента загрузки данного экземпляра.
     HRESULT: 0x80010002 Подробные сведения: Вызов был отклонен фильтром сообщений.
    Это затронуло один или несколько рабочих процессов.  
    Имя рабочего процесса: Microsoft.SystemCenter.DiscoverWindowsClientComputer 
    ИД экземпляра: {8B9B2645-E3C7-D147-3C63-36EB6308D223} 
    Группа управления: UK
    Дополнительные сведения можно найти в центре справки и поддержки, в "http://go.microsoft.com/fwlink/events.asp".



    27 ноября 2008 г. 11:42
  • Первый вариант см. выше - проблемы с WMI. Запустит любой скрипт, посмотрите. Поделайте WMI запросы.....

    Второй вариант - мониторы\дискавер и тп запущены со слишком низкими правами.

     

    27 ноября 2008 г. 12:17
    Отвечающий
  • WMI вроде бы отрабатывает, поделал запросы нормальные ответы получал. Пробовал запускать и из под доменадмина - итог такой же. Причем раньше все было нормально, проблема возникла после восстановления агента через консоль SCOM. Пробовал удалить и установить вручную, не помогло.
    8 декабря 2008 г. 7:34
  • Другой сервер, проблема почти таже.
    Сразу после старта службы OpsMgr Health Service резко взлетает загрузка процессора, снова видно что грузят ее cscripts. Потом скрипты отрабатывают/заверщаются по таймауту и загрузка падает. Переодически, когда скрипты запускаются, загрузка снова растет. Это нормальная ситуация или как? Сервер в такие моменты почти колом встает.

    16 декабря 2008 г. 13:33
  • Нет, не нормальная. WMIDIAG запускали?

     

    16 декабря 2008 г. 14:38
    Отвечающий
  • Уже разбираюсь с результатами, ошибки нехватки прав. Спасибо за статью в блоге!
    17 декабря 2008 г. 6:49
  • От WMIDiaga добился ответа что все ОК (немного подправил права доступа, как он сказал). В итоге все равно 100% загрузка процессора и памяти. Обновление, указанное в вашем блоге поставил. Попробовал запускать скрипты на которые ругался OpsMgr в журнале вручную, вот что получилось:

    C:\SCOM_scripts>"C:\WINDOWS\system32\cscript.exe" //nologo "AD_Lost_And_Found_Object_Count.vbs" uptk3.office.inprom.ru false
    <Collection><DataItem type="System.PropertyBagData" time="2008-12-18T11:01:46.77 06951+03:00" sourceHealthServiceId="42E81AD3-1FF2-BF98-4811-6B1943018D91"><ConversionType>PerformanceData<ConversionType><Property Name="StatusInstance" VariantType="8"></Property><Property Name="StatusValue" VariantType="8">0</Property></DataItem></Collection>

    C:\SCOM_scripts>"C:\WINDOWS\system32\cscript.exe" //nologo "AD_General_Response.vbs" uptk3.office.inprom.ru 4 false {51AA67EE-3551-AD82-CB4E-D14F6903989B}
    <Collection><DataItem type="System.PropertyBagData" time="2008-12-18T11:03:26.81
    37283+03:00" sourceHealthServiceId="42E81AD3-1FF2-BF98-4811-6B1943018D91"><ConversionType>StateData</ConversionType><Property Name="State" VariantType="8">GOOD</Property><Property Name="EventID" VariantType="8">1091</Property></DataItem><DataItem type="System.PropertyBagData" time="2008-12-18T11:03:26.8137283+03:00" sourceHealthServiceId="42E81AD3-1FF2-BF98-4811-6B1943018D91"><ConversionType>PerformanceData</ConversionType><Property Name="StatusInstance" VariantType="8"></Property><Property Name="StatusValue" VariantType="8">0.015</Property></DataItem></Collection>

    C:\SCOM_scripts>"C:\WINDOWS\system32\cscript.exe" //nologo "AD_Global_Catalog_Search_Response.vbs" uptk3.office.inprom.ru (objectCategory=DMD) false 4 {51AA67EE-3551-AD82-CB4E-D14F6903989B}
    <Collection><DataItem type="System.PropertyBagData" time="2008-12-18T11:04:58.82
    58199+03:00" sourceHealthServiceId="42E81AD3-1FF2-BF98-4811-6B1943018D91"><ConversionType>StateData</ConversionType><Property Name="State" VariantType="8">GOOD</Property><Property Name="EventID" VariantType="8">1090</Property></DataItem><DataItem type="System.PropertyBagData" time="2008-12-18T11:04:58.8258199+03:00" sourceHealthServiceId="42E81AD3-1FF2-BF98-4811-6B1943018D91"><ConversionType>PerformanceData</ConversionType><Property Name="StatusInstance" VariantType="8"></Property><Property Name="StatusValue" VariantType="8">0</Property></DataItem></Collection>
    C:\SCOM_scripts>



    18 декабря 2008 г. 8:15
  • Внешне - нормальные коллекции. У вас DHCP\DNS менеджмент паки не установлены? Вы пробовали запустить process monitor от Sysinternals с фильтром "cscript.exe" чтобы посмотреть какие именно скрипты работают (пытаются) во время высокой загрузки?

    SP1 и все пост-фиксы, надеюсь, установлены?

    18 декабря 2008 г. 9:46
    Отвечающий
  • DNS\DHCP не установлены. Используются: МП AD, WinServer 2003, HP, Dell, SQL 2005
    Procmon попробую запустить, лог выложу.
    Ставилось все с диска, который по идее включает в себя SP1: версия 6.0.6278 Или вы про патчки в windows?
    18 декабря 2008 г. 11:41
  • Я именно про патчи к opsmgr (хотя патчи к ОС тоже важны и их нужно устанавливать).

    DELL....попробуйте его удалить. И после посмотреть будут ли продолжаться высокие закрузки CPU.

     

    18 декабря 2008 г. 16:27
    Отвечающий
  • После рестарта HealthService начинает работать дискавери для объектов, описанных в МП.

    Соответственно, на разных серваках после рестарта может работать дискавери для разных объектов

    Какой софт из того, что ты мониторишь паками, стоит на серваках, которые тормозят?

    На остальных серваках с тем-же софтом такие проблемы есть?

    19 декабря 2008 г. 12:09