none
Managment server not monitored RRS feed

  • Вопрос

  • OpsMgr 2012 R2

    предыстория всего: была недоступность сервера БД, после чего как все связи восстановились, была замечена проблема на одном из серверов мониторинга.

    структура системы примерно такая:

    компьютерных объектов около 200 (Windows + Linux; 50\50%)

    Network Devices около 800 (большая часть по icmp)

    основной сервер мониторинга - в основном все что мониторится агентами, в т.ч. и linux

    дополнительный сервер мониторинга - забрал на себя весь icmp+snmp мониторинг

    сервер мониторинга ДМЗ

    Так вот, дополнительный сервер мониторинга находится в состоянии Not Monitored т.е. Серый

    при том management group health показывает такую картину:

    если Operations Manager Agents провалиться в health explorer то видим красным только dependency мониторы, под которыми ниже разве что несколько объектов в обслуживании и больше ничего (красного тем более)

    эвент лог opsmgr на данном сервере пестрит такими ошибками:

    4506    Data was dropped due to too much outstanding data in rule "System.NetworkManagement.NodeResponseTime" running for instance "M-ACCESS-SC1-R13" with id:"{3BFAC4A6-B2BC-385D-74DA-FF15C5798E3F}" in management group "OMG01".

    служба агента мониторинга перезапускалась, папка Health Service State очищалась (переименовывалась), кэш чистился  - все эти процедуры были сделаны в первую очередь, и некоторое время сервер отображается "зеленым" потом опять сереет.

    после сброса кэша и очистки папки бывают такие варнинги:

    5206    In memory container (hash table System.Health.EntityStateChangeData) had to drop data because it reached max limit. Possible data loss.

    и спустя какое то время все приходит к такой ошибке:

    5300    Local health service is not healthy. Entity state change flow is stalled with pending acknowledgement. 

    Management Group: OMG01 
    Management Group ID: fcaf586f-be87-ba17-9b44-7bd24c6752b2

    что делать? куда копать?



    • Изменено Swepper 12 марта 2018 г. 9:54
    12 марта 2018 г. 9:32

Ответы

Все ответы