none
Troubleshooting установки/работы агентов SCCM 2012 RRS feed

  • Вопрос

  • Приветствую. Приключилась беда: все сломалосЪ и рассыпалосЪ, на ровном месте...

    В общем, ни с того, ни с сего, агенты перестали регаться на сервере после пуш/мануал инсталла. Именно так, тупо, "вчера работало, сегодня перестало". Изменений конфигурации не было, кофе на сервак не проливал. Итого, прошу помощи у знатоков: с чего начать расследование, какие логи курить, над чем голову ломать? Ознакомился с тредом, но не мой случай: клиенты гарантированно подходят под параметры (грубо говоря один и тот же сиспрепнутый образ развернутый вчера - работал, а развернутый сегодня - перестал).

    Второй признак того, что что-то явно не так - установка апдейтов (на еще активных клиентах, впрочем они могут быть активны уже чисто номинально): статус "Подготовка к загрузке", все, оно умерло, ибо эта подготовка не заканчивается никогда...

    Третий признак  того, что что-то явно не так - SCEP: активные клиенты вроде как обновляются, но на сервере последнее развертывание зарегано неделю тому назад...

    Четвертый признак  того, что что-то явно не так - пуш инсталл агента: агент ставиться, цепляет все необходимые данные о сайте, но "Действий" всего два, "Цикл получения и оценки политик компьютера/пользователя" + стоит автоустановка за компанию клиента SCEP'а, но не тут то было, теперь будьте любезны вручную...

    В общем, примерно так, по-мелочи, извините за сумбур. С чего предложите начать? Авансом спасибо =)

    ЗЫ: лог на клиенте ccmsetup.log заканчивается фееричным "CcmSetup is exiting with return code 0"...

    4 октября 2012 г. 14:46

Ответы

  • Чудес действительно не бывает, бывает неведомая фигня, глюки и багофичи =)

    1. клиенты не отмечались на сервере как активные, но при этом сервер фиксировал фактическое наличие клиента после пуш инсталла

    2. развертывание образов произвожу не через службы WDS (работал, знаю, не легла душа...), для PXE использую Linux-based сервер, агента в образ НЕ вшивал. В перспективе планирую использовать автодеплой агентов.

    3. раскурил озвученные логи, посмотрел эвенты, в общем все свелось к тому, что посчитал виновниками появление "SMS Executive detected that this component stopped unexpectedly" и падение SMS Managment пула в IIS

    4. попытки разобраться почему служба падает на ровном месте ни к чему не привели. Солюшн "Solution: Refer to your ConfigMgr Documentation or the Microsoft Knowledge Base for further troubleshooting information." поверг в ступор, официальный траблшутинг от мелкомягких по ошибке 1104 (http://technet.microsoft.com/en-us/library/cc723603.aspx) - в уныние. Может кривовато искал? Поделитесь ссылами, если есть.

    5. т.к. описанные выше симптомы уж больно смахивают на проблемы сервера, а не клиента (EP'ы перестали ставиться, апдейты не тянуться, etc), плюнул и поступил неспортивно, каюсЪ: не стал дальше ломать себе мозг и сделал рекавери сайта. В итоге все "починилось" и пока вроде как даже работает.

    Вот сижу теперь и думаю, что это: чудеса, неведомая фигня, глюк или багофича. Так что жду очередного анэкспектеда на ровном месте и верю в лучшее =)


    5 октября 2012 г. 13:23

Все ответы

  • Тут речь,как понимаю, про клиентов, а не агентов

    >>агенты перестали регаться на сервере<<

    assigned = NO ? 

    >>но "Действий" всего два, <<

    некоректное назначение клиентов, клиенты не могут получить политики, смотрите  policyagent.log и  locationsservices.log

    >>сиспрепнутый образ развернутый вчера - работал, а развернутый сегодня - перестал<<

    Вы разворачиваете через OSD? Если так, то опять же про политики

    http://blogs.technet.com/b/configurationmgr/archive/2010/09/13/solution-after-a-configmgr-2007-osd-task-sequence-completes-the-client-may-not-automatically-pull-down-policy.aspx

    >> лог на клиенте ccmsetup.log заканчивается фееричным "CcmSetup is exiting with return code 0".<<

    Что говорит о том что клиент успешно установлен, но опять же не понятно из топика отражается ли он в консоли как установленный или проблемы с репортингом клиента

    http://blogs.technet.com/b/configurationmgr/archive/2009/08/10/troubleshooting-issues-where-clients-are-not-reporting.aspx



    4 октября 2012 г. 18:43
    Отвечающий
  • Начните со служб самого ConfigMgr (рабочая область мониторинга).

    http://sccm.com.ua/

    5 октября 2012 г. 7:18
    Отвечающий
  • Чудес же не бывает. Мог кто нибудь крутить границы сайта AD на домен-контроллерах? В эвентах сайт-сервера всё чисто?

    Vladimir Zelenov | http://systemcenter4all.wordpress.com


    5 октября 2012 г. 8:58
    Отвечающий
  • Чудес действительно не бывает, бывает неведомая фигня, глюки и багофичи =)

    1. клиенты не отмечались на сервере как активные, но при этом сервер фиксировал фактическое наличие клиента после пуш инсталла

    2. развертывание образов произвожу не через службы WDS (работал, знаю, не легла душа...), для PXE использую Linux-based сервер, агента в образ НЕ вшивал. В перспективе планирую использовать автодеплой агентов.

    3. раскурил озвученные логи, посмотрел эвенты, в общем все свелось к тому, что посчитал виновниками появление "SMS Executive detected that this component stopped unexpectedly" и падение SMS Managment пула в IIS

    4. попытки разобраться почему служба падает на ровном месте ни к чему не привели. Солюшн "Solution: Refer to your ConfigMgr Documentation or the Microsoft Knowledge Base for further troubleshooting information." поверг в ступор, официальный траблшутинг от мелкомягких по ошибке 1104 (http://technet.microsoft.com/en-us/library/cc723603.aspx) - в уныние. Может кривовато искал? Поделитесь ссылами, если есть.

    5. т.к. описанные выше симптомы уж больно смахивают на проблемы сервера, а не клиента (EP'ы перестали ставиться, апдейты не тянуться, etc), плюнул и поступил неспортивно, каюсЪ: не стал дальше ломать себе мозг и сделал рекавери сайта. В итоге все "починилось" и пока вроде как даже работает.

    Вот сижу теперь и думаю, что это: чудеса, неведомая фигня, глюк или багофича. Так что жду очередного анэкспектеда на ровном месте и верю в лучшее =)


    5 октября 2012 г. 13:23
  • Эххх... Нам не дали логи покурить :)


    Vladimir Zelenov | http://systemcenter4all.wordpress.com

    5 октября 2012 г. 13:51
    Отвечающий
  • Why not? Сам не люблю работать с системами в состоянии blackbox'a, но тут не хватило терпения + даже наличие логов как-то не особо меня толкнуло на нахождение корня зла =) Warning, manyletters

    Eventlog:

    • 1104 SMS Server: On 05.10.2012 13:56:17, component SMS_MP_CONTROL_MANAGER on computer srv-spb-sccm.mydomain.ru reported:  SMS Executive detected that this component stopped unexpectedly.

      Possible cause: The component is experiencing a severe problem that caused it to stop unexpectedly.
      Solution: Refer to your ConfigMgr Documentation or the Microsoft Knowledge Base for further troubleshooting information.
    • 5010 WAS: Не удается найти описание для идентификатора события 5010 из источника Microsoft-Windows-WAS. Вызывающий данное событие компонент не установлен на этом локальном компьютере или поврежден. Установите или восстановите компонент на локальном компьютере.

      Если событие возникло на другом компьютере, возможно, потребуется сохранить отображаемые сведения вместе с событием.

      К событию были добавлены следующие сведения:

      SMS Management Point Pool
      24100
    • 63 WMI: Не удается найти описание для идентификатора события 63 из источника Microsoft-Windows-WMI. Вызывающий данное событие компонент не установлен на этом локальном компьютере или поврежден. Установите или восстановите компонент на локальном компьютере.

      Если событие возникло на другом компьютере, возможно, потребуется сохранить отображаемые сведения вместе с событием.

      К событию были добавлены следующие сведения:

      SMSDPProvider
      root\SCCMDP
    • 2003 IIS-W3SVC-PerfCounters: Не удается найти описание для идентификатора события 2003 из источника Microsoft-Windows-IIS-W3SVC-PerfCounters. Вызывающий данное событие компонент не установлен на этом локальном компьютере или поврежден. Установите или восстановите компонент на локальном компьютере.

      Если событие возникло на другом компьютере, возможно, потребуется сохранить отображаемые сведения вместе с событием.

      К событию были добавлены следующие сведения:

      12:00:00

    ccmsetup.log:

    • как я уже упоминал "CcmSetup is exiting with return code 0" - неактуально...

    policyagent.log:

    • состояние нестояния, зациклено на
    instance of CCM_PolicyAgent_AssignmentsRequested
    {
    	AuthorityName = "SMS:001";
    	ClientID = "GUID:72078A22-71A2-4BDB-B3B9-022037A0A992";
    	DateTime = "20121005002820.340000+000";
    	ProcessID = 3408;
    	ResourceName = "WS-TEST";
    	ResourceType = "Machine";
    	ThreadID = 5888;
    };
    ]LOG]!><time="04:28:20.341-240" date="10-05-2012" component="PolicyAgent_RequestAssignments" context="" type="1" thread="5888" file="event.cpp:729">
    <![LOG[Requesting User policy assignments for 'S-1-5-21-1180337776-3397157336-3563951993-6452']LOG]!><time="04:28:20.342-240" date="10-05-2012" component="PolicyAgent_RequestAssignments" context="" type="1" thread="4736" file="requestassignmentstask.cpp:1418">
    <![LOG[Requesting User policy from authority 'SMS:001']LOG]!><time="04:28:20.353-240" date="10-05-2012" component="PolicyAgent_RequestAssignments" context="" type="1" thread="4736" file="requestassignmentstask.cpp:1474">
    <![LOG[Raising event:
    
    instance of CCM_PolicyAgent_AssignmentsRequested
    {
    	AuthorityName = "SMS:001";
    	ClientID = "GUID:72078A22-71A2-4BDB-B3B9-022037A0A992";
    	DateTime = "20121005002820.597000+000";
    	ProcessID = 3408;
    	ResourceName = "S-1-5-21-1180337776-3397157336-3563951993-6452";
    	ResourceType = "User";
    	ThreadID = 4736;
    };
    ]LOG]!><time="04:28:20.597-240" date="10-05-2012" component="PolicyAgent_RequestAssignments" context="" type="1" thread="4736" file="event.cpp:729">
    <![LOG[Requesting User policy assignments for 'S-1-5-21-1180337776-3397157336-3563951993-1631']LOG]!><time="05:01:31.305-240" date="10-05-2012" component="PolicyAgent_RequestAssignments" context="" type="1" thread="3292" file="requestassignmentstask.cpp:1418">
    <![LOG[Requesting User policy from authority 'SMS:001']LOG]!><time="05:01:31.316-240" date="10-05-2012" component="PolicyAgent_RequestAssignments" context="" type="1" thread="3292" file="requestassignmentstask.cpp:1474">
    <![LOG[Raising event:

    • после рекавери:
    instance of CCM_PolicyAgent_AssignmentsRequested
    {
    	AuthorityName = "SMS:001";
    	ClientID = "GUID:72078A22-71A2-4BDB-B3B9-022037A0A992";
    	DateTime = "20121005162819.985000+000";
    	ProcessID = 3408;
    	ResourceName = "WS-TEST";
    	ResourceType = "Machine";
    	ThreadID = 5284;
    };
    ]LOG]!><time="20:28:19.985-240" date="10-05-2012" component="PolicyAgent_RequestAssignments" context="" type="1" thread="5284" file="event.cpp:729">
    <![LOG[Requesting User policy assignments for 'S-1-5-21-1180337776-3397157336-3563951993-6452']LOG]!><time="20:28:20.310-240" date="10-05-2012" component="PolicyAgent_RequestAssignments" context="" type="1" thread="4440" file="requestassignmentstask.cpp:1418">
    <![LOG[Requesting User policy from authority 'SMS:001']LOG]!><time="20:28:20.324-240" date="10-05-2012" component="PolicyAgent_RequestAssignments" context="" type="1" thread="4440" file="requestassignmentstask.cpp:1474">
    <![LOG[Raising event:
    
    instance of CCM_PolicyAgent_AssignmentsReceived
    {
    	AuthorityName = "SMS:001";
    	ClientID = "GUID:72078A22-71A2-4BDB-B3B9-022037A0A992";
    	DateTime = "20121005162820.380000+000";
    	ProcessID = 3408;
    	ReplyType = "Full";
    	ResourceName = "S-1-5-21-1180337776-3397157336-3563951993-6452";
    	ResourceType = "User";
    	ThreadID = 4224;
    };
    ]LOG]!><time="20:28:20.380-240" date="10-05-2012" component="PolicyAgent_ReplyAssignments" context="" type="1" thread="4224" file="event.cpp:729">
    <![LOG[Received User full policy update with 0 assignments]LOG]!><time="20:28:20.383-240" date="10-05-2012" component="PolicyAgent_ReplyAssignments" context="" type="1" thread="4224" file="replyassignmentsendpoint.cpp:1910">
    <![LOG[Cleaning policy for 'SMS:001' in '\\WS-TEST\ROOT\ccm\Policy\S_1_5_21_1180337776_3397157336_3563951993_6452\RequestedConfig']LOG]!><time="20:28:20.383-240" date="10-05-2012" component="PolicyAgent_ReplyAssignments" context="" type="1" thread="4224" file="policyutil.cpp:8726">
    <![LOG[User 'S-1-5-21-1180337776-3397157336-3563951993-6452' is member of 19 Domain Security Groups]LOG]!><time="20:28:20.384-240" date="10-05-2012" component="PolicyAgent_ReplyAssignments" context="" type="1" thread="4224" file="replyassignmentsendpoint.cpp:735">
    <![LOG[Requesting User policy assignments for 'S-1-5-21-1180337776-3397157336-3563951993-1631']LOG]!><time="21:01:31.400-240" date="10-05-2012" component="PolicyAgent_RequestAssignments" context="" type="1" thread="3768" file="requestassignmentstask.cpp:1418">
    <![LOG[Requesting User policy from authority 'SMS:001']LOG]!><time="21:01:31.412-240" date="10-05-2012" component="PolicyAgent_RequestAssignments" context="" type="1" thread="3768" file="requestassignmentstask.cpp:1474">
    <![LOG[Raising event:


    locationservices.log:

    • состояние нестояния, зациклено на
    <![LOG[Current AD site of machine is spb]LOG]!><time="14:35:23.788-240" date="10-05-2012" component="LocationServices" context="" type="1" thread="5456" file="lsad.cpp:601">
    <![LOG[Current AD forest name is mydomain.ru, domain name is mydomain.ru]LOG]!><time="14:35:23.801-240" date="10-05-2012" component="LocationServices" context="" type="1" thread="5456" file="lsad.cpp:668">
    <![LOG[Begin checking Alternate Network Configuration]LOG]!><time="14:35:23.801-240" date="10-05-2012" component="LocationServices" context="" type="1" thread="5456" file="ccmiputil.cpp:1069">
    <![LOG[Finished checking Alternate Network Configuration]LOG]!><time="14:35:23.803-240" date="10-05-2012" component="LocationServices" context="" type="1" thread="5456" file="ccmiputil.cpp:1146">
    

    • после рекавери:
    <![LOG[Current AD site of machine is spb]LOG]!><time="16:36:59.434-240" date="10-05-2012" component="LocationServices" context="" type="1" thread="4844" file="lsad.cpp:601">
    <![LOG[Begin checking Alternate Network Configuration]LOG]!><time="16:36:59.434-240" date="10-05-2012" component="LocationServices" context="" type="1" thread="4844" file="ccmiputil.cpp:1069">
    <![LOG[Finished checking Alternate Network Configuration]LOG]!><time="16:36:59.436-240" date="10-05-2012" component="LocationServices" context="" type="1" thread="4844" file="ccmiputil.cpp:1146">
    <![LOG[Calling back with the following distribution points]LOG]!><time="16:36:59.439-240" date="10-05-2012" component="LocationServices" context="" type="1" thread="4844" file="lsutils.cpp:359">
    <![LOG[Distribution Point='http://srv-spb-sccm.mydomain.ru/SMS_DP_SMSPKG$/790813eb-d7ba-4302-ad2d-2a5c20f550c1', Locality='LOCAL', DPType='SERVER', Version='7711', Capabilities='<Capabilities SchemaVersion="1.0"><Property Name="SSLState" Value="0"/></Capabilities>', Signature='http://srv-spb-sccm.mydomain.ru/SMS_DP_SMSSIG$/790813eb-d7ba-4302-ad2d-2a5c20f550c1.1.tar', ForestTrust='TRUE']LOG]!><time="16:36:59.439-240" date="10-05-2012" component="LocationServices" context="" type="1" thread="4844" file="lsutils.cpp:383">
    <![LOG[Calling back with locations for location request {7ED2B13E-3517-4C1B-9D81-080A4A3D0C3F}]LOG]!><time="16:36:59.464-240" date="10-05-2012" component="LocationServices" context="" type="1" thread="4844" file="replylocationsendpoint.cpp:211">
    <![LOG[Executing Task LSRefreshLocationsTask]LOG]!><time="17:35:23.406-240" date="10-05-2012" component="LocationServices" context="" type="1" thread="5980" file="scheduledcleanupendpoint.cpp:116">
    <![LOG[Executing Task LSRefreshLocationsTask]LOG]!><time="18:35:23.209-240" date="10-05-2012" component="LocationServices" context="" type="1" thread="2120" file="scheduledcleanupendpoint.cpp:116">
    <![LOG[Executing Task LSRefreshLocationsTask]LOG]!><time="19:35:24.833-240" date="10-05-2012" component="LocationServices" context="" type="1" thread="5344" file="scheduledcleanupendpoint.cpp:116">
    <![LOG[Executing Task LSRefreshLocationsTask]LOG]!><time="20:35:24.996-240" date="10-05-2012" component="LocationServices" context="" type="1" thread="4440" file="scheduledcleanupendpoint.cpp:116">
    

    В общем, кроме того, что у сервера падает основная служба (инфу по которой я так и не нашел), проблема с WMI (repair не помог), а клиент не находит MP и DP - я ничего не увидел. Примерно так. Извиняюсь за форматирование - данный форум вводит меня в ступор, мне все никак не освоить его инструментарий, вроде почти WYSIWYG, но отступы не отступы, пропуск строк не пропуск строк и прочие непонятные мне вещи. А еще он глючит в огнелисе, осле (!) и только в хромом работает нормально =)

    5 октября 2012 г. 17:45
  • Вообще, на сайт серверах не рекомендуется выполнять WMI Repair. В вашем случае вы пошли верным путем и сделали восстановление сайта. Когда происходят какие либо проблемы с точкой управления смотрите лог mpcontrol.log. Вот список логов и за что они отвечают - http://technet.microsoft.com/en-us/library/hh427342.aspx

    Vladimir Zelenov | http://systemcenter4all.wordpress.com

    5 октября 2012 г. 17:58
    Отвечающий
  • Благодарю, ссылку в букмарки, что-то я упустил эту ветку в документации. Собсно mpcontrol.log указывает на ошибку, гугление по которой намекает на проблемы с WMI

    SMS_MP_CONTROL_MANAGER received START notification.	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    MPStart(): Registered for Notifications.	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    CMPControlManager::ReadConfigurationSettings(): m_pWmi->GetObject() failed - 0x80041010	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    CMPControlManager::ReadConfigurationSettings(): Periodic Interval is 1800000	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    CMPControlManager::ReadConfigurationSettings(): WINS Interval is 14400000	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    MPStart(): ReadConfigurationSettings() returned 0x80041010.	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    Querying MPHealthCheckIntervalInSeconds registry value returned a status of 2.	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    Querying MPHealthCheckTimeoutInSeconds registry value returned a status of 2.	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    Querying MPHealthCheckStatusMessageIntervalInSeconds registry value returned a status of 2.	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    Querying NLBNodeAvailabilityState registry value returned a status of 2.	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    MPStart(): Read all MP Settings.	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    MPStart(): SSL disabled.	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    CMPControlManager::WriteToCCMSettings(): WMI Connection established.	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    CMPControlManager::WriteToCCMSettings(): pWmi->GetObject() failed - 0x80041002	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    STATMSG: ID=5432 SEV=E LEV=M SOURCE="SMS Server" COMP="SMS_MP_CONTROL_MANAGER" SYS=srv-spb-sccm.mydomain.ru SITE=001 PID=18420 TID=21468 GMTDATE=Чт окт 04 10:10:27.746 2012 ISTR0="" ISTR1="" ISTR2="" ISTR3="" ISTR4="" ISTR5="" ISTR6="" ISTR7="" ISTR8="" ISTR9="" NUMATTRS=0	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    MPStart(): WriteToCCMSettings() failed - 0x80041002	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    SMS_MP_CONTROL_MANAGER failed to start with 0x80041002	SMS_MP_CONTROL_MANAGER	04.10.2012 14:10:27	21468 (0x53DC)
    SMS_EXECUTIVE started SMS_MP_CONTROL_MANAGER as thread ID 23276 (0x5AEC).	SMS_MP_CONTROL_MANAGER	04.10.2012 15:10:30	2160 (0x0870)


    • Изменено BoOgatti 5 октября 2012 г. 18:21
    5 октября 2012 г. 18:11
  • >>Вообще, на сайт серверах не рекомендуется выполнять WMI Repair. <<

    Я бы даже сказал, что это полностью не поддерживаемое решение и может привести к полной потере работоспособности сайта.

    Как я понимаю вы сделали Repair до того как клиенты стали "отваливаться"?


    6 октября 2012 г. 8:19
    Отвечающий
  • Нет, разумеется после: когда все встало колом и терять уже было нечего (+ машины были предварительно остановлены и сделаны снимки). Пока все работало, я сидел в операторской консоли, наслаждался отчетами, а про существование сервера и его настройку уже успел забыть.
    • Изменено BoOgatti 6 октября 2012 г. 9:18
    6 октября 2012 г. 9:07
  • BoOgatti удалось решить проблему?

    Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции корпорации Microsoft. Вся информация предоставляется "как есть" без каких-либо гарантий

    12 октября 2012 г. 17:32
    Модератор
  • Да, тему можно клозить. Правда, ее бы переименовать, т.к. дело оказалось не в бобине, и агенты по-сути тут не причем. Скорее траблшутинг MP.
    12 октября 2012 г. 20:32
  • Столкнулся с этой проблемой и нашел решение на support.microsoft.com 

    http://support.microsoft.com/kb/2796086

    Uninstall the MP role, change HKLM\SOFTWARE\Microsoft\CCM\CcmEval\NotifyOnly to "TRUE", reboot, and reinstall the MP role. You don't have to uninstall the CCM client from the MP server.



    Alex

    • Предложено в качестве ответа ArhangeL87 2 августа 2013 г. 10:18
    2 августа 2013 г. 10:18