none
Сервер виснет намертво RRS feed

  • Общие обсуждения

  • День добрый.

    Есть сервер с 2008r2. В общем с если ему отключить питание (даже выключенному) начинаются проблемы. Сервер может зависнуть при загрузке на надписи "Нажмите alt+ctrl+del". Если он не зависает на этом моменте, то на долю секунды все замирает, в том числе и курсор мыши. Повторяется все ровно через час. И так до полного умирания. Смерть сервера выглядит как просто застывшая картинка. Ни курсор ни чего не реагирует. Индикаторы диска молчат. Помогает только резет. Так повторяется до того момента, когда все само собой приходит в норму. На сервере стоит 1с, sql 2005. В планировщике все просмотрел, нет задач при старте системы и потом с периодичностью в 1 час. Куда копать?

Все ответы

  • предположу что раритетный сиквел стоит на неменее раритетном железе которое вполне вероятно могло начать сыпаться как бывает с разного рода отработавшими 2 срока компонентами.

    Смотрите логи сервера если есть iLo или iDrack + логи системы в моменты когда возникает проблема


    The opinion expressed by me is not an official position of Microsoft

    Модератор
  • Конфа сервера:

    Есть Сервер DEPO Storm xeon X5690, мать x8dtn+-f, 36 ГБ ОЗУ.
    2 Рейд контроллера
    1) intel ich8r/ich9r/ich10r/do sata raid controller
    RAID 1
    Система win serv 2008r2
    сервер 1с
    sql 2005
    поднят RDP
    и так по мелочи.
    2) adaptec RAID 5805
    RAID 10
    Базы, файлы и прочее.

    Логи смотрел, в том то и дело что ничего нет. Грешил на сетевую. Отключал на ночь. Не помогло. Самое интересное что в безопасном режиме он ни разу не умирал.

    И еще смущает то, что подвисы на секунду, которые и приводят к смерти происходят с периодичностью ровно в 1 час с момента включения сервера.

    В момент замирания сервера процессы и службы не добавляются. 

    И да забыл добавить. После примерно недели умирания сервера все налаживается. Он потом может работать без перезагрузок месяцами. До следующего отключения электричества.
    • Изменено sl4y3r23 31 мая 2019 г. 5:45

  • Смотрите логи сервера если есть iLo или iDrack + логи системы в моменты когда возникает проблема


    The opinion expressed by me is not an official position of Microsoft

    iLo или iDrack это аналоги IPMI? Через него и сижу. Где там логи посмотреть можно? Дело в том что если сервер умирает, то в IPMI ничего не происходит, т.е. картинка так же висит как и на прямом подключении к серверу.
  • Доброе утро.

    Откройте Event Logs -> Applications and Services Logs -> Microsoft -> Windows -> CodeIntegrity -> Operational разверните. Посмотрите, если ли какие то события или ошибки  здесь.

  • Доброе утро!

    Работает. Число событий - 1.

    Предупреждение за 2013 год: Windows was unable to update the boot cache file. Status 0xc0000034.

  • Доброе утро!

    Работает. Число событий - 1.

    Предупреждение за 2013 год: Windows was unable to update the boot cache file. Status 0xc0000034.


    В таком случае советую мемтестом проверить оперативку, после диски проверить.
  • Диски проверяются после отключений автоматически, как системный рейд так и не системный. Я изначально на оборудование и грешил, но сервер умирает либо при включении, либо во время работы с периодичностью ровно час с момента включения. Он подлагивает через час, два, три, десять после включения секунда в секунду. Потом просто перестает и работает в штатном режиме.

    Мемтест это тот который при включении?

  • Диски проверяются после отключений автоматически, как системный рейд так и не системный. Я изначально на оборудование и грешил, но сервер умирает либо при включении, либо во время работы с периодичностью ровно час с момента включения. Он подлагивает через час, два, три, десять после включения секунда в секунду. Потом просто перестает и работает в штатном режиме.

    Мемтест это тот который при включении?

    Вот

    Качаете, записываете на флеху и грузитесь с нее. Запускаете полный тест. Полный тест занимает прилично времени. 96 гигов тестил 24 часа

  • Ну если это память, то почему в безопасном режиме ни зависов при включении ни через час после него нет? Сейчас сервер залип после 3 часов работы. Ровно. При старте запустил стандартное тестирование памяти. Неполадок не обнаружено. Сегодня вечером постараюсь сделать мемтест полный. О результатах отпишусь.
  • Учитывая, то там крутится SQL, проверьте, что вы настроили его по best practice, тезисно ниже:

    • размер кластера под БД  = 64 кбайта (default = 4 кбайта)
    • отдельная доменная УЗ для служб Database Engine, Reporting Services, SQL Server Agent
    • отдельные диски под DB, TempDB, Logs (DB + TempDB)
    • ограничить размер выделяемой ОЗУ (через Management Studio)
    • Размер логов (около 20% от размера БД)
    • Для сервисной УЗ задать в secpol.msc "Lock pages in memory", "Perform maintenance tasks"

    Также проверьте есть ли у вас дамп -> C:\Windows\Memory.dmp

  • Я так скажем не очень разбираюсь в настройка sql. Не могли бы вы более подробно расписать что и где посмотреть?

    Вот что я проверил:

    Также проверьте есть ли у вас дамп -> C:\Windows\Memory.dmp - это есть 1 064 263 кб

    • отдельные диски под DB, TempDB, Logs (DB + TempDB) - все на разных.
    • ограничить размер выделяемой ОЗУ (через Management Studio) - у меня минимальная 0 максимальная 20000 мб. На сколько изменить?

    • размер кластера под БД  = 64 кбайта (default = 4 кбайта) - это не нашел(
    • отдельная доменная УЗ для служб Database Engine, Reporting Services, SQL Server Agent - тут тоже не понял
    • Для сервисной УЗ задать в secpol.msc "Lock pages in memory", "Perform maintenance tasks" - и вот тут поподробней
    • спасибо.

    Случайно нажал на "Пометить как ответ".
    • Изменено sl4y3r23 31 мая 2019 г. 10:20