none
Регулярно подвисает сервер RRS feed

  • Вопрос

  • Всем доброго времени суток!

    Имею сервер Windows 2008R2 SP1, член домена, на нем сервер терминалов, SQL 2008, 1С.

    Пользователей примерно 200.

    Железо - Supermicro X9Dri-F/256 RAM/AOC-S2208L-H8iR

    Симптомы:

    Периодически и без системы (несколько раз в час) перестает реагировать клава, мышь по экрану ерзает, но реакции от системы нет, т.е. как бы замирает на 2-10 секунд все, кроме мыши.

    Симптомы одинаковы как при работе в терминале(соединение при этом не отваливается), так и непосредственно на консоли сервера локально.

    В логах винды чисто, загрузка процессоров 10-50 %, выше - редко (во всяком случае, я не вижу скачков на графике во время подвисания). Память занята на 70%. В логах IPMI ничего достойного внимания тоже не нашел.

    Подвисания также зависят от того, как много пользователей в данный момент работает - ночью, когда я один, все нормально.

    Приблизительно началось после следующих изменений:

    1. Был произведен массовый перевод пользователей сервера терминалов на доменные учетные записи вместо локальных сервера

    2. Была установлена плата Intel SSD PCIe 3700 400Gb

    Единственное, что смог найти - https://www.supermicro.com.tw/support/faqs/faq.cfm?faq=16724 не помогло.

    Никто не сталкивался ни с чем подобным?


    test



    • Изменено AM303030 30 июля 2016 г. 10:06
    30 июля 2016 г. 9:55

Ответы

  • у себя подобное полечил прошивкой Bios, HDD и SAS контроллера (что именно из трёх помогло в моём случае не знаю, но проблема исчезла.)

    ОТЕЦъ

    • Помечено в качестве ответа AM303030 13 декабря 2016 г. 7:05
    30 июля 2016 г. 10:27
  • Фризы похожи на дисковые очереди

    Если раньше такого поведения не было а сейчас появилось возможна проблема с одним из дисков рейда

    Так же при 200 пользователях лучше использовать фермы из 2-4 серверов. В вашем случае это вполне могут быть виртуалки (это из личных наблюдений)


    The opinion expressed by me is not an official position of Microsoft

    31 июля 2016 г. 6:57
    Модератор
  • В общем, помогли установка свежего драйвера nvme и\или обновление прошивки RAID-controller'a

    Всем спасибо, отцу отдельно! :-)


    test


    • Изменено AM303030 13 декабря 2016 г. 7:05
    • Предложено в качестве ответа Vector BCOModerator 13 декабря 2016 г. 7:16
    • Помечено в качестве ответа Vector BCOModerator 13 декабря 2016 г. 7:16
    13 декабря 2016 г. 7:04
  • Монитор ресурсов (perfmon) откройте и посмотрите нет ли bottleneck по диску, оперативной памяти, процессору. Посмотрите по шкале как используется оперативная память. 

    Посмотрите здоровье дискового массива (какой RAID используется ?), каков % фрагментации  ? 

    Посмотрите температурные показатели сервера, нет ли перегрева в какой либо зоне сервера ?

    1 августа 2016 г. 9:34

Все ответы

  • у себя подобное полечил прошивкой Bios, HDD и SAS контроллера (что именно из трёх помогло в моём случае не знаю, но проблема исчезла.)

    ОТЕЦъ

    • Помечено в качестве ответа AM303030 13 декабря 2016 г. 7:05
    30 июля 2016 г. 10:27
  • Здравствуйте,

    - В системных событиях что-то логируется?
    - Контроллер логирует ли какие-то аномалии в состояниях дисков?
    - На момент проблем какие-то задачи, например резервное копирование выполняется?

    Best Regards, Andrei ...
    MCP

    • Изменено SQxModerator 30 июля 2016 г. 13:33 добавлено
    30 июля 2016 г. 13:32
    Модератор
  • Фризы похожи на дисковые очереди

    Если раньше такого поведения не было а сейчас появилось возможна проблема с одним из дисков рейда

    Так же при 200 пользователях лучше использовать фермы из 2-4 серверов. В вашем случае это вполне могут быть виртуалки (это из личных наблюдений)


    The opinion expressed by me is not an official position of Microsoft

    31 июля 2016 г. 6:57
    Модератор
  • Монитор ресурсов (perfmon) откройте и посмотрите нет ли bottleneck по диску, оперативной памяти, процессору. Посмотрите по шкале как используется оперативная память. 

    Посмотрите здоровье дискового массива (какой RAID используется ?), каков % фрагментации  ? 

    Посмотрите температурные показатели сервера, нет ли перегрева в какой либо зоне сервера ?

    1 августа 2016 г. 9:34
  • Привет всем,

    выкинул SSD PCIe 3700 400Gb, все подвисания\фризы моментально прекратились (бенчмарки карта показывала близкие к производителю, тем не менее).

    Через пару дней попробую другую такую же карту, но, скорее всего, будет то же самое.

    Некоторую надежду дает свежий, августовский драйвер intel nvme, посмотрим, как будет после его установки.


    test

    21 августа 2016 г. 6:09
  • В общем, помогли установка свежего драйвера nvme и\или обновление прошивки RAID-controller'a

    Всем спасибо, отцу отдельно! :-)


    test


    • Изменено AM303030 13 декабря 2016 г. 7:05
    • Предложено в качестве ответа Vector BCOModerator 13 декабря 2016 г. 7:16
    • Помечено в качестве ответа Vector BCOModerator 13 декабря 2016 г. 7:16
    13 декабря 2016 г. 7:04