none
Disk transfer (reads and writes) latency is too high RRS feed

  • Вопрос

  • Не понял логики:

    Alert Description:

    The threshold for the Logical Disk\Avg. Disk sec/Transfer performance counter has been exceeded. The value that exceeded the threshold is: 254.479859417817.  

    Это у нас среднее вычислилось из 5ти попыток или только значение в выборке которое превышает порог? (судя по англоязычному ресурсу среднее из 5ти)

    Alert Context:

     

    Object Name: LogicalDisk
    Counter Name: Avg. Disk sec/Transfer
    Instance Name: D:
    Average Sample Value: 3.29321080353111E-03
    Number of Samples: 5

     

    тогда 3.29 (надо полагать мс) что за значение? и тоже среднее...

    12 ноября 2010 г. 9:50

Ответы

  • >да, так и получается, тут скорей всего получается из-за того что пока создавался алерт пик изменился и упал с 254с до 3.29мс, уменя помниться тоже были такие несостыковки, я это так для себя объяснял.

    Близко, но не совсем так =))

    Все, что вы видите в Alert Description (на закладке General, если вы откроете свойства алерта или в панели деталей, если смотрите в alert view) появляется там в момент создания алерта (то есть в тот момент, когда в первый раз превышается порог). И больше это поле в течении "жизни алерта" не меняется.

    Но! Данные от монитора продолжают приходить. И контекст меняется, и содержит последнее принятое значение. Контекст - обновляемая "часть" алерта, дескрипшн - статичная.

    И оба значения - средние. Просто это разные наборы семплов, по времени разные.

    Поэтому вы видите разные значения.


    http://OpsMgr.ru/
    • Помечено в качестве ответа k0syak 13 ноября 2010 г. 4:35
    12 ноября 2010 г. 16:28
    Отвечающий

Все ответы

  • да, так все и есть, а что смущает?

    Можно залезть в Perf manager и посмотреть какие значения получаются там, если вы не верите SCOM.

    12 ноября 2010 г. 10:06
  • 250мс=3,29?
    12 ноября 2010 г. 10:08
  • Нет почему м\с, секунды.

    LogicalDisk|PhysicalDisk\Avg. Disk sec/Transfer:

    Indicates how fast data is being moved (in seconds). Measures the average time of each data transfer, regardless of the number of bytes read or written. Shows the total time of the read or write, from the moment it leaves the Diskperf.sys driver to the moment it is complete.
    A high value for this counter might mean that the system is retrying requests due to lengthy queuing or, less commonly, disk failures.

    вообще то число, которое указано получается 3,29 * 10^-3 , т.е. 0,00329 и это секунды, т.е. да 3.29 м\с, а у вас просто 254 сек :)

    12 ноября 2010 г. 10:14
  • :) не с той стороны мс написал... 254=3,29мс     и это всё в одном алерте пишется...надо полагать чтобы вынести мозг админам

    12 ноября 2010 г. 10:25
  • да, так и получается, тут скорей всего получается из-за того что пока создавался алерт пик изменился и упал с 254с до 3.29мс, уменя помниться тоже были такие несостыковки, я это так для себя объяснял.

    12 ноября 2010 г. 10:37
  • >да, так и получается, тут скорей всего получается из-за того что пока создавался алерт пик изменился и упал с 254с до 3.29мс, уменя помниться тоже были такие несостыковки, я это так для себя объяснял.

    Близко, но не совсем так =))

    Все, что вы видите в Alert Description (на закладке General, если вы откроете свойства алерта или в панели деталей, если смотрите в alert view) появляется там в момент создания алерта (то есть в тот момент, когда в первый раз превышается порог). И больше это поле в течении "жизни алерта" не меняется.

    Но! Данные от монитора продолжают приходить. И контекст меняется, и содержит последнее принятое значение. Контекст - обновляемая "часть" алерта, дескрипшн - статичная.

    И оба значения - средние. Просто это разные наборы семплов, по времени разные.

    Поэтому вы видите разные значения.


    http://OpsMgr.ru/
    • Помечено в качестве ответа k0syak 13 ноября 2010 г. 4:35
    12 ноября 2010 г. 16:28
    Отвечающий
  • да, так и получается, тут скорей всего получается из-за того что пока создавался алерт пик изменился и упал с 254с до 3.29мс, уменя помниться тоже были такие несостыковки, я это так для себя объяснял.

    вы точно уверены, что в сообщениях которые присылает SCOM, значение The value that exceeded the threshold is: 254.479859417817 - в секундах а не миллисекундах? У нас просто SCOM шлёт кучу подобных сообщений с разных серверов и приложений (SQL, Exchange, AD) например:

    Alert: Disk transfer (reads and writes) latency  is too high

    Source: C:

    Path: Server

    Last modified by: System

    Last modified time: 09.02.2011 13:36:43

    Alert description: The threshold for the Logical Disk\Avg. Disk sec/Transfer performance counter has been exceeded. The value that exceeded the threshold is: 21856.1768916897 .

    Это получается 6 часов? Я правильно понимаю что параметр Logical Disk\Avg. Disk sec/Transfer означает среднее время в секундах, из пяти вариантов (значение по умолчанию в мониторе), затраченное на перемещение данных ? Хотелось бы знать какие значения можно считать критическими и как реагировать на подобного рода сообщения?


    Gangster
    9 февраля 2011 г. 13:18
  • > означает среднее время в секундах, из пяти вариантов (значение по умолчанию в мониторе), затраченное на перемещение данных ?

    Да. Подробности: http://technet.microsoft.com/en-us/library/cc938959.aspx

    > Хотелось бы знать какие значения можно считать критическими и как реагировать на подобного рода сообщения?

    Это индивидуально и зависит от достаточно большого количества факторов. Реагировать в общем-то можно только двумя способами: Если это возможно - оптимизировать системы хранения (дисковые подсистемы), если невозможно - повышать пороговое значение монитора или отключать его вообще для некоторых систем.


    http://OpsMgr.ru/
    9 февраля 2011 г. 15:03
    Отвечающий
  • Попробывали запустить perfmon на сервер с которого постоянно шли сообщения Logical Disk\Avg. Disk sec/Transfer performance с большими задержками, не каких подобных значений полученно не было, и на время запуска perfmon SCOM не присылал аналогичные сообщения, полсе отключения perfmon сообщения продолжили поступать. Можно ли говорить о неисправности данного монитора?

    Gangster
    15 февраля 2011 г. 9:29
  • Нельзя.


    http://OpsMgr.ru/
    15 февраля 2011 г. 9:48
    Отвечающий