none
Подвисает сервер на базе Windows 2008 R2 RRS feed

  • Общие обсуждения

  • Добрый день. Имеются 4 разных сервера в 4-х различных городах. Все они "разливались" из одного образа развертывания WDS. В образе WDS находятся:

    Windows 2008 R2 с обновлениями от ноября 2014 года

    SQL Express 2008 R2

    Сервер 1С:Предприятия 8.1

    Microsoft Office 2010

    FortiClient 5.2.3

    После установки системы - серверы отправлялись в разные города и уже на "точках" там поднимался КД. Уровень домена и леса - 2003. Из доменных компьютеров - всего 3 штуки. Домены везде разные, связи между ними - никакой. В какой-то момент времени, два из четырех серверов начинают подвисать. "Подвисание" заключается в отсутствии возможности терминального подключения, отсутствие файлового доступа и пр, хотя ping проходит. Помогает только "холодная" перезагрузка.

    Обратил внимание, что у "проблемных" серверов начинает расти память. Плавно, но растет.. Предполагаю, что в какой-то момент времени, у сервера не остается свободной памяти и он "замыкается в себе".

    Решили поэксперементировать с одним сервером, который располагается в "шаговой" доступности.

    • Удалили FortiClient - результат такой же, "виснет".
    • Добавили память (с 4 Гб до 8 Гб) - результат такой же, "виснет".
    • Отключили сервисы SQLExpress и Сервера 1С:Предприятия - результат такой же, "виснет".
    • Удалили 4 KB (KB2977629, KB 2888049, KB 2817183, KB 2929437, где-то прочитал, что IE11 некорректно работает на Windows 2008R2) - результат такой же, "виснет".
    • Обновили все драйверы на самые свежие- результат такой же, "виснет".
    • Запускали команду sfc /scannow - повреждений нет - результат такой же, "виснет

    Причем, как было сказано - так себя ведут только 2 сервера из четырех. Остальные два - полностью адекватны и работают. Аптайм у одного из них - около 40 дней, что для наших условий - более чем показатель стабильной работы.

    Никто не сталкивался с таким "поведением" ? Хотя бы понять, в какую сторону "копать"....

    Буду признателен за советы и помощь. Готов ответить на сопутствующие вопросы.

    13 июля 2015 г. 14:06

Все ответы

  • попробуйте обновить прошивки биоса, контролеров, и пр. железок

    обновления вы ставили, или они все обновлены по состоянию на конец 2014 года?

    13 июля 2015 г. 14:10
    Модератор
  • Обновить прошивки - проблематично, т.к. в разных городах они стоят.. И они, по сути своей, в продакшене...

    Обновления Microsoft - на одном, который работает - ставили последние. И на одном - который падает - тоже ставили последние...

    13 июля 2015 г. 14:14
  • большинство производителей прошивки выпускают в виде пары тройки .exe  файлов которые ставяться под системой, и после лишь требуют перезагрузки

    Как минимум вы можете проверить этот вариант на том сервере который у вас под рукой

    ПС регулярное обновление прошивок равно как и обновление системы во многом направлено на избежание в том числе и такого рода проблем

    13 июля 2015 г. 14:23
    Модератор
  • Здравствуйте,

    А что у Вас логируется в системных событиях? Пробовали определить какой процесс использует всю память? Если был Bsod приложите ссылку на дампы на сторонние файловые хранилища, может они что-то покажут.

    Best Regards, Andrei ...
    Microsoft Certified Professional

    13 июля 2015 г. 21:58
    Модератор
  • BSODов нет никаких. Просто, перестает отвечать почти на любые запросы. В последнее время стал помогать удаленный shutdown. До этого - только хард-ресет.

    В SystemLog - перед удаленные ребутом было событие с кодом 6

    Неустранимый сбой операции ввода-вывода, инициированной реестром. Реестру не удалось очистить куст (файл): "\SystemRoot\System32\Config\SOFTWARE".

    Когда не помогал и удаленный shutdown - в логе "файловый сервер" логгировалось событие с кодом 2019 -

    Сервер не смог выделить память из невыгружаемого пула памяти, так как невыгружаемый пул пуст.

    Память использует один процесс - svchost.exe.

    14 июля 2015 г. 6:02
  • Да, и еще. Есть два сервера, установленные в офисе на стендах. Вся система "разлита" с помощью все того же образа WDS. На одном - аптайм 21 день. На другом, пока неделя, но все равно, оба работают и обслуживают все запросы. Не падают...
    14 июля 2015 г. 6:04
  • - Вот ссылки на фиксы, которые исправляют утечки памяти, ознакомьтесь возможно описание похоже на Вашу проблему.

    1) https://support.microsoft.com/ru-ru/kb/2889748
    2) https://support.microsoft.com/ru-ru/kb/977357
    3) https://support.microsoft.com/en-us/kb/2847346


    -Уточните используется ли какое-то антивирусное ПО?

    Пробуйте на время отключить Windows Update, и посмотрите если проблема воспроизводиться.


    Best Regards, Andrei ...
    Microsoft Certified Professional

    • Изменено SQxModerator 14 июля 2015 г. 7:42 исправлено
    14 июля 2015 г. 6:21
    Модератор
  • Антивирус - используется FortiClient. Но на проблемных серверах мы пробовали его деинсталировать полностью - ситуация не меняется. А на "рабочих" - он установлен, проблем не выявлено.

    Windows Update отключали.

    Ниже - таблица мат.плат и версий BIOS на серверах.

    Условные обозначения Виснет да\нет Мат.плата Версия BIOS
    Л да S3210SH S3200X38.86B.00.00.0052.112920101508
    КЦ да S3420GP S3420GP.86B.01.00.0042.042920102218
    С да S3420GP S3420GP.86B.01.00.0042.042920102218
    П нет S1200BT S1200BT.86B.02.00.0035.030220120927
    М нет S3420GPV S3420GP.86B.01.00.0051.051120121541
    КП нет S1200BTL S1200BT.86B.02.00.0042.050820141549
    СС нет S3420GP S3420GP.86B.01.00.0051.051120121541
    СК нет S3420GP S3420GP.86B.01.00.0042.042920102218

    На сервере Л сегодня обновили BIOS. Ждемс...


    14 июля 2015 г. 7:51
  • Железо, как я понимаю, разное?
    14 июля 2015 г. 9:05
  • Ну, как видите - да
    14 июля 2015 г. 9:06
  • Доброе утро\день\вечер, коллеги.

    Информирую о новостях. Хотя, новостями назвать трудно. Сервер Л опять подвис. В пятницу он работал, в понедельник, уже отказался принимать на себя RDP. Хотя пинги на него были регулярные. Как я упоминал вышел - BIOS на нем обновлен. В логах 18.07.2015 в 3.15 зафиксирована ошибка с кодом 2019:

    Сервер не смог выделить память из невыгружаемого пула памяти, так как невыгружаемый пул пуст.

    Более никаких ошибок нет.

    P.S. Да, и мы на удаленном сервере С также обновили BIOS до последних версий. Эффект такой же.. Подвисает.

    20 июля 2015 г. 6:18
  • Сервер не смог выделить память из невыгружаемого пула памяти, так как невыгружаемый пул пуст.
    В большинстве случаев виновником такого поведение является "Сервер 1С:Предприятия 8.1".
    Если возможно попробуйте оставить сервер в работе без ПО 1С и понаблюдать, если подтвердиться обратиться в тех. поддержку 1С за устранением дефектов в продукте.

    Анализ использования памяти ядра отдельными процессами

    Иногда отдельные процессы могут испытывать утечку памяти ядра - это можно выявить, изучив данные об использовании выгружаемой/невыгружаемой памяти на уровне каждого их процессов:

    1. Откройте Диспетчер задач Windows, перейдите на вкладку Процессы, в верхнем меню выберите Вид -> Выбрать столбцы и поставьте галочки ИД процесса (PID), Код сеанса, Дескрипторы, Память - выгружаемый пул и Память - невыгружаемый пул.

    2. С помощью сортировки найдите процессы с наибольшим количеством выгружаемой памяти, невыгружаемой памяти и дескрипторов - скорее всего, именно они являются причиной утечки памяти.

    3. Выясните, каким приложениям и службам принадлежат эти процессы, и остановите/отключите их, перезапустив соответствующие приложения/службы. Проверьте, стабилизировалось ли использование выгружаемой/невыгружаемой памяти.

    Ознакомьтесь также со статьей "Pushing the Limits of Windows: Paged and Nonpaged Pool"

    Best Regards, Andrei ...
    Microsoft Certified Professional

    • Изменено SQxModerator 20 июля 2015 г. 9:37 добавлено
    20 июля 2015 г. 9:26
    Модератор
  • В большинстве случаев виновником такого поведение является "Сервер 1С:Предприятия 8.1".
    Если возможно попробуйте оставить сервер в работе без ПО 1С и понаблюдать, если подтвердиться обратиться в тех. поддержку 1С за устранением дефектов в продукте.

    Сам сервер предприятия остановлен уже давно. Установлен, но остановлен, простите за каламбур. Наша группа разработки вынужден запускать процесс "обычной" 1С-ки для совершения регламентных задач...
    20 июля 2015 г. 9:54
  • Тогда Вам следует попробовать отловить процесс из-за которого происходить утечка памяти.
    svchost.exe - используют многие службы, возможно в системе присутствует маскированный процесс svchost.exe (rootkit). Как вариант анализатором процессов или Process Explorer выбрать svchost.exe, который грузит процесс, и он должен показать сервисы, которые загружаются через svchost.exe.

    Best Regards, Andrei ...
    Microsoft Certified Professional

    • Изменено SQxModerator 20 июля 2015 г. 10:06 исправлено
    20 июля 2015 г. 10:03
    Модератор
  • 1С.... Office (и зачем он на сервере...).. КД.. а Вы случайно не используете их так же в качестве терминальных серверов в конечных точках?

    26 июля 2015 г. 22:56
  • ну, зачем 1С и Office на сервере - вопрос не по теме обсуждения. А насчет терминальных серверов - не очень понял формулировку. На этот сервер имеются терминальные подключения в рамках имеющихся штатных лицензий и механизмов.
    27 июля 2015 г. 6:24
  • Это просто из личного опыта - сервер терминальный любил подвисать.. и все бы ничего, но неприятно его жестоко ребутать, да и работа стоит у людей.. а разгадка фокуса оказалась проста - заканчивалась оперативка (а вот и такое бывает), а причина сего неприятного явления еще проще - буфер обмена: пользователи любят скопировать чего-нибудь немаленькое с сервера и положить на рабочий стол - работает же))) только вот одно немаленькое+другое немаленькое+... и оперативка уходила в расход.. Я два дня пытался понять, почему зависает, но поняв отключил буфер в терминальной сессии между сервером и клиентом с отправлением для сохранения в шары, коих у пользователей немало. В логах, разумеется, была тишина, ведь ничего клинического не происходило, работа же идет)))

    Вот поэтому и спросил про терминальный доступ, собственно.

    27 июля 2015 г. 16:14
  • Добрый день, коллеги.

    Если кому-то интересно. На сервер Л и на сервер С (согласно таблице) было установлено обновление KB2847346. На сервер C также были установлены все последние обновления с сервера Microsoft Update. Аптаймы повысились (раньше сервера и четыре дня не могли отработать, а сейчас, у сервера Л аптайм около 14 дней). Однако, нагрузка на память все равно неуклонно растет.. Медленно "и печально", но растет.. До зависания пока еще не "дошли", но сей момент уже близок....

    3 августа 2015 г. 7:50