none
Мониторинг CPU RRS feed

  • Вопрос

  • Доброго всем дня! Вопрос возможно простой, но все же не смог с помощью override eго решить.

    Задача такая - отсылать нотификацию о загрузке CPU на сервере выше 95% в том случае, если она постоянная, ну к примеру 20-30 секунд. А не так, что загрузка скаканула до 100% - прилетел алерт, я лезу на сервак..там все в норме. А так как интервал проверки 900 секунд, то и отбойник приходит через 15 минут. Настраивать интервал проверки меньше - не вижу смысла. Иначе как ложные алерты все равно могут прилетать.

    Подскажите плиз, может кто сталкивался ?

    17 августа 2015 г. 11:22

Все ответы

  • Поставьте интервал опроса (Interval Seconds), например, 60 секунд, а количество циклов проверки (Number of Samples) 2 или 3. Т.е. если CPU Utilization будет больше 95% на протяжении 2х60 секунд (или 3х60 секунд), то сработает алерт.

    Innovation distinguishes between a leader and a follower - Steve Jobs

    17 августа 2015 г. 12:20
  • Хм, странно....т.е сейчас по дефолту стоит интервал опроса (Interval Seconds) 900 секунд, а количество циклов проверки (Number of Samples) 3. И получается что алерт должен прилетать если CPU Utilization будет больше 95% на протяжении 3х900 секунд ? Т.е. если CPU будет зашкаливать на протяжении 45 минут ? Или я не так понял ?


    Или это значит, что за 900 секунд будет сделано 3 проверки на сколько загружен CPU ?
    • Изменено John_kadet 17 августа 2015 г. 13:40
    17 августа 2015 г. 13:30
  • Хм, странно....т.е сейчас по дефолту стоит интервал опроса (Interval Seconds) 900 секунд, а количество циклов проверки (Number of Samples) 3. И получается что алерт должен прилетать если CPU Utilization будет больше 95% на протяжении 3х900 секунд ? Т.е. если CPU будет зашкаливать на протяжении 45 минут ? Или я не так понял ?


    Или это значит, что за 900 секунд будет сделано 3 проверки на сколько загружен CPU ?

    Вы все правильно поняли - алерт придет через 45 минут при длительной утилизации CPU. Более того он придет только в том случае, если еще будет очередь на процессоре.

    Vladimir Zelenov | http://systemcenter4all.wordpress.com

    18 августа 2015 г. 5:39
    Отвечающий
  • Почему тогда нотификация мне пришла с интервалом ровно в 15 минут. Опишу для ясности подробнее:

    Первая нотификация пришла в 19.30:

    Alert Name: Total CPU Utilization Percentage is too high

    Severity:

    Critical


    Вторая нотификация пришла в 19.45:

    Alert Name: Total CPU Utilization Percentage is too high

    Severity:

    Critical (Closed)

    По логам никаких проблем не наблюдалось, т.е.  был так скажем скачок до 100%, что и вызвало срабатывание алерта (может и другое, не уверен, это предположения). Может превысился порог CPU Queue Lenght Threshold

    Вот Screen переопределения на этом сервере:

    Дополню еще вопросом: можно ли переконфигурить таким образом, что бы нотификация приходила только в случае срабатывания алерта при 2х последовательных проверках
    • Изменено John_kadet 18 августа 2015 г. 9:34
    18 августа 2015 г. 8:01
  • Для начала обращаю внимание, что данный монитор отслеживает два показателя: Processor Information\% Processor Time\_Total and System Queue Length

    Т.е. возможно проблема не с загрузкой а с очередями. Следует посмотреть в историю срабатываний монитора, там пишутся конкретные данные по обоим параметрам.

    Ну а сама логика следующая:

    1. показатели проверяются каждые 15 минут (4 семпла в час, вполне себе достаточно).
    2. на основании среднего значения для 3 последних семплов делается вывод, что какой-то из двух показателей превышает порог - приходит 1 алерт (19.30).
    3. через 15 минут среднее значение пересчитывается по новым данным, делается вывод что ситуация исправилась и алерт закрывается (19.45).

    Чтобы уменьшить количество семплов нужно поправить циферку в параметре "Number of Samples".

    Хотя я бы предложил увеличить частоту проверки в 3 раза (на 300 секунд), а "Number of Samples" увеличить в два раза (до 6), тогда картинка более сглаженная будет за тот же отрезок времени.


    • Предложено в качестве ответа PeTrProduct 18 августа 2015 г. 11:36
    • Изменено PeTrProduct 18 августа 2015 г. 13:22
    18 августа 2015 г. 11:36
  • Спасибо за помощь!
    19 августа 2015 г. 7:14