Спрашивающий
Подвисает сервер на базе Windows 2008 R2

Общие обсуждения
-
Добрый день. Имеются 4 разных сервера в 4-х различных городах. Все они "разливались" из одного образа развертывания WDS. В образе WDS находятся:
Windows 2008 R2 с обновлениями от ноября 2014 года
SQL Express 2008 R2
Сервер 1С:Предприятия 8.1
Microsoft Office 2010
FortiClient 5.2.3
После установки системы - серверы отправлялись в разные города и уже на "точках" там поднимался КД. Уровень домена и леса - 2003. Из доменных компьютеров - всего 3 штуки. Домены везде разные, связи между ними - никакой. В какой-то момент времени, два из четырех серверов начинают подвисать. "Подвисание" заключается в отсутствии возможности терминального подключения, отсутствие файлового доступа и пр, хотя ping проходит. Помогает только "холодная" перезагрузка.
Обратил внимание, что у "проблемных" серверов начинает расти память. Плавно, но растет.. Предполагаю, что в какой-то момент времени, у сервера не остается свободной памяти и он "замыкается в себе".
Решили поэксперементировать с одним сервером, который располагается в "шаговой" доступности.
- Удалили FortiClient - результат такой же, "виснет".
- Добавили память (с 4 Гб до 8 Гб) - результат такой же, "виснет".
- Отключили сервисы SQLExpress и Сервера 1С:Предприятия - результат такой же, "виснет".
- Удалили 4 KB (KB2977629, KB 2888049, KB 2817183, KB 2929437, где-то прочитал, что IE11 некорректно работает на Windows 2008R2) - результат такой же, "виснет".
- Обновили все драйверы на самые свежие- результат такой же, "виснет".
- Запускали команду sfc /scannow - повреждений нет - результат такой же, "виснет
Причем, как было сказано - так себя ведут только 2 сервера из четырех. Остальные два - полностью адекватны и работают. Аптайм у одного из них - около 40 дней, что для наших условий - более чем показатель стабильной работы.
Никто не сталкивался с таким "поведением" ? Хотя бы понять, в какую сторону "копать"....
Буду признателен за советы и помощь. Готов ответить на сопутствующие вопросы.
- Изменен тип Petko KrushevMicrosoft contingent staff, Moderator 21 августа 2015 г. 12:08
13 июля 2015 г. 14:06
Все ответы
-
попробуйте обновить прошивки биоса, контролеров, и пр. железок
обновления вы ставили, или они все обновлены по состоянию на конец 2014 года?
13 июля 2015 г. 14:10Модератор -
Обновить прошивки - проблематично, т.к. в разных городах они стоят.. И они, по сути своей, в продакшене...
Обновления Microsoft - на одном, который работает - ставили последние. И на одном - который падает - тоже ставили последние...
13 июля 2015 г. 14:14 -
большинство производителей прошивки выпускают в виде пары тройки .exe файлов которые ставяться под системой, и после лишь требуют перезагрузки
Как минимум вы можете проверить этот вариант на том сервере который у вас под рукой
ПС регулярное обновление прошивок равно как и обновление системы во многом направлено на избежание в том числе и такого рода проблем
13 июля 2015 г. 14:23Модератор -
Здравствуйте,
А что у Вас логируется в системных событиях? Пробовали определить какой процесс использует всю память? Если был Bsod приложите ссылку на дампы на сторонние файловые хранилища, может они что-то покажут.Best Regards, Andrei ...
Microsoft Certified Professional13 июля 2015 г. 21:58Модератор -
BSODов нет никаких. Просто, перестает отвечать почти на любые запросы. В последнее время стал помогать удаленный shutdown. До этого - только хард-ресет.
В SystemLog - перед удаленные ребутом было событие с кодом 6
Неустранимый сбой операции ввода-вывода, инициированной реестром. Реестру не удалось очистить куст (файл): "\SystemRoot\System32\Config\SOFTWARE".
Когда не помогал и удаленный shutdown - в логе "файловый сервер" логгировалось событие с кодом 2019 -
Сервер не смог выделить память из невыгружаемого пула памяти, так как невыгружаемый пул пуст.
Память использует один процесс - svchost.exe.
14 июля 2015 г. 6:02 -
Да, и еще. Есть два сервера, установленные в офисе на стендах. Вся система "разлита" с помощью все того же образа WDS. На одном - аптайм 21 день. На другом, пока неделя, но все равно, оба работают и обслуживают все запросы. Не падают...14 июля 2015 г. 6:04
-
- Вот ссылки на фиксы, которые исправляют утечки памяти, ознакомьтесь возможно описание похоже на Вашу проблему.
1) https://support.microsoft.com/ru-ru/kb/2889748
2) https://support.microsoft.com/ru-ru/kb/977357
3) https://support.microsoft.com/en-us/kb/2847346
-Уточните используется ли какое-то антивирусное ПО?
Пробуйте на время отключить Windows Update, и посмотрите если проблема воспроизводиться.
Best Regards, Andrei ...
Microsoft Certified Professional- Изменено SQxModerator 14 июля 2015 г. 7:42 исправлено
14 июля 2015 г. 6:21Модератор -
Антивирус - используется FortiClient. Но на проблемных серверах мы пробовали его деинсталировать полностью - ситуация не меняется. А на "рабочих" - он установлен, проблем не выявлено.
Windows Update отключали.
Ниже - таблица мат.плат и версий BIOS на серверах.
Условные обозначения Виснет да\нет Мат.плата Версия BIOS Л да S3210SH S3200X38.86B.00.00.0052.112920101508 КЦ да S3420GP S3420GP.86B.01.00.0042.042920102218 С да S3420GP S3420GP.86B.01.00.0042.042920102218 П нет S1200BT S1200BT.86B.02.00.0035.030220120927 М нет S3420GPV S3420GP.86B.01.00.0051.051120121541 КП нет S1200BTL S1200BT.86B.02.00.0042.050820141549 СС нет S3420GP S3420GP.86B.01.00.0051.051120121541 СК нет S3420GP S3420GP.86B.01.00.0042.042920102218 На сервере Л сегодня обновили BIOS. Ждемс...
- Изменено Zhuravlev Dmitriy 14 июля 2015 г. 7:52
14 июля 2015 г. 7:51 -
Железо, как я понимаю, разное?14 июля 2015 г. 9:05
-
Ну, как видите - да14 июля 2015 г. 9:06
-
Доброе утро\день\вечер, коллеги.
Информирую о новостях. Хотя, новостями назвать трудно. Сервер Л опять подвис. В пятницу он работал, в понедельник, уже отказался принимать на себя RDP. Хотя пинги на него были регулярные. Как я упоминал вышел - BIOS на нем обновлен. В логах 18.07.2015 в 3.15 зафиксирована ошибка с кодом 2019:
Сервер не смог выделить память из невыгружаемого пула памяти, так как невыгружаемый пул пуст.
Более никаких ошибок нет.
P.S. Да, и мы на удаленном сервере С также обновили BIOS до последних версий. Эффект такой же.. Подвисает.
20 июля 2015 г. 6:18 -
Сервер не смог выделить память из невыгружаемого пула памяти, так как невыгружаемый пул пуст.
В большинстве случаев виновником такого поведение является "Сервер 1С:Предприятия 8.1".
Если возможно попробуйте оставить сервер в работе без ПО 1С и понаблюдать, если подтвердиться обратиться в тех. поддержку 1С за устранением дефектов в продукте.
Анализ использования памяти ядра отдельными процессами
Иногда отдельные процессы могут испытывать утечку памяти ядра - это можно выявить, изучив данные об использовании выгружаемой/невыгружаемой памяти на уровне каждого их процессов:
-
Откройте Диспетчер задач Windows, перейдите на вкладку Процессы, в верхнем меню выберите Вид -> Выбрать столбцы и поставьте галочки ИД процесса (PID), Код сеанса, Дескрипторы, Память - выгружаемый пул и Память - невыгружаемый пул.
-
С помощью сортировки найдите процессы с наибольшим количеством выгружаемой памяти, невыгружаемой памяти и дескрипторов - скорее всего, именно они являются причиной утечки памяти.
- Выясните, каким приложениям и службам принадлежат эти процессы, и остановите/отключите их, перезапустив соответствующие приложения/службы. Проверьте, стабилизировалось ли использование выгружаемой/невыгружаемой памяти.
Best Regards, Andrei ...
Microsoft Certified Professional- Изменено SQxModerator 20 июля 2015 г. 9:37 добавлено
20 июля 2015 г. 9:26Модератор -
-
В большинстве случаев виновником такого поведение является "Сервер 1С:Предприятия 8.1".
Сам сервер предприятия остановлен уже давно. Установлен, но остановлен, простите за каламбур. Наша группа разработки вынужден запускать процесс "обычной" 1С-ки для совершения регламентных задач...
Если возможно попробуйте оставить сервер в работе без ПО 1С и понаблюдать, если подтвердиться обратиться в тех. поддержку 1С за устранением дефектов в продукте.
20 июля 2015 г. 9:54 -
Тогда Вам следует попробовать отловить процесс из-за которого происходить утечка памяти.
svchost.exe - используют многие службы, возможно в системе присутствует маскированный процесс svchost.exe (rootkit). Как вариант анализатором процессов или Process Explorer выбрать svchost.exe, который грузит процесс, и он должен показать сервисы, которые загружаются через svchost.exe.
Best Regards, Andrei ...
Microsoft Certified Professional- Изменено SQxModerator 20 июля 2015 г. 10:06 исправлено
20 июля 2015 г. 10:03Модератор -
1С.... Office (и зачем он на сервере...).. КД.. а Вы случайно не используете их так же в качестве терминальных серверов в конечных точках?
26 июля 2015 г. 22:56 -
ну, зачем 1С и Office на сервере - вопрос не по теме обсуждения. А насчет терминальных серверов - не очень понял формулировку. На этот сервер имеются терминальные подключения в рамках имеющихся штатных лицензий и механизмов.27 июля 2015 г. 6:24
-
Это просто из личного опыта - сервер терминальный любил подвисать.. и все бы ничего, но неприятно его жестоко ребутать, да и работа стоит у людей.. а разгадка фокуса оказалась проста - заканчивалась оперативка (а вот и такое бывает), а причина сего неприятного явления еще проще - буфер обмена: пользователи любят скопировать чего-нибудь немаленькое с сервера и положить на рабочий стол - работает же))) только вот одно немаленькое+другое немаленькое+... и оперативка уходила в расход.. Я два дня пытался понять, почему зависает, но поняв отключил буфер в терминальной сессии между сервером и клиентом с отправлением для сохранения в шары, коих у пользователей немало. В логах, разумеется, была тишина, ведь ничего клинического не происходило, работа же идет)))
Вот поэтому и спросил про терминальный доступ, собственно.
27 июля 2015 г. 16:14 -
Добрый день, коллеги.
Если кому-то интересно. На сервер Л и на сервер С (согласно таблице) было установлено обновление KB2847346. На сервер C также были установлены все последние обновления с сервера Microsoft Update. Аптаймы повысились (раньше сервера и четыре дня не могли отработать, а сейчас, у сервера Л аптайм около 14 дней). Однако, нагрузка на память все равно неуклонно растет.. Медленно "и печально", но растет.. До зависания пока еще не "дошли", но сей момент уже близок....
3 августа 2015 г. 7:50