none
Терминальная ферма на win2016, вопрос по нагрузке RRS feed

  • Общие обсуждения

  • Доброго времени, суток!
    Не знаю, как сформулировать даже вопрос, потому просто опишу ситуацию. Есть ферма, состоящая из сервера БД, двух connection broker и трех session host серверов. Когда там работало 100-150 человек - все было замечательно, сейчас когда там более 220 сеансов, периодически разные session host начинают "вешаться" - загрузка проца - 100%.

    Конфигурация каждого session host - 40 ядер\80 гб памяти. Было замечено - что когда происходит выход или вход пользователя - у этого сеанса резко возрастает потребление процессора. Т.е. рабочий сеанс, где у человека открыты ворды, ексели, 1сы и прочее потребляет 2-3% процессора, а входящий на сервер пользователь может "скушать" 10-15%.

    Как я понимаю, в какойто момент наступает эффект снежного кома - он несправляется с текущими выходами\входами, в итоге люди по несколько минут логинятся, те кто работает на сервере - у них все висит, т.к. процессор на 100% загружен.

    Просмотр логов явного указания на проблему не дал. Периодически появляются сообщения не возможности зарегистрировать COM приложение, но это происходит когда проблема уже началась, и является следствием - просто не хватает процессорного времени.

    Соответственно, все сервера виртуализированы. На хостах виртуализации одновременно с session host больше ВМ, которые сильно потребляют ресурсы нет.

    Возможно это важно, используется user profile disk.

    Отсюда вопросы:

    1)Подготавливаю четвертый сервер session host - это "спасет отца русской демократии"?

    2)У кого как построен терминальный доступ, поделитесь, пожалуйста, опытом - сколько серверов, ВМ или физические, какое общее количество сеансов, сколько сеансов на каждом серваке, управляете ли динамически нагрузкой(если один сервер начинает проседать, блокировать новые подключения на него).

    Простите за длинную простыню текста. Буду рад идеям. Спасибо!

    • Изменен тип Vector BCOModerator 26 февраля 2018 г. 22:20 нет единоверного решения. Это явное обсуждение
    24 января 2018 г. 15:20

Все ответы

  • Наши эксперименты показали что нормально работают хосты на которых работает не более 50 человек (с нашим специфичным софтом и с нашими специфичными задачами), а дальше поведение сервера становится нестабильным.

    В одном из топиков полугодичной давности встречал исследование коллеги которые упирались в то, что на железных серверах он получал намного лучшие результаты производительности, чем на виртуальных (в моей среде это не так заметно).

    В нашей компании есть фермы и виртуальные и железные: железная ферма из 2х нод с 3 брокерами держит порядка 100 сеансов. Одна нода может обслуживать и 100 но не продолжительное время.

    Ферма виртуалок в принципе работает по тому же принципу, но количество сеасвов там гораздо меньше (всего до 50 в праздник), поэтому они работают в режиме актив пасив, и переключаются раз в месяц в момент установки обнов.


    The opinion expressed by me is not an official position of Microsoft


    24 января 2018 г. 17:31
    Модератор
  • Тогда и я поделюсь... До фермы было два сервера, одни на 12R2 другой на 2008R2.. Железки были с 8 реальными ядрами + НТ. Они держали порядка 120 пользователей. пока не перешли на 1с 8 и все не стали поголовно запускать УПП. 

    Затыкалось так. При входе экран сервера, применение настроек для пользователя и все.. и никого не пустит. Причем те кто работали уже там, продолжали работать, загрузка 70-90% процессора и все ((

    Сейчас у меня ферма из 5 железных RS500-e8 с двумя 12 ядерными. И при этом сначала собрал на железе. Но при доступе в 100 человек, винсервер 2016 снова не пускает никого. Ограничил не больше 80 на хост, все заработало стабильно даже с тем, что на серверах запускают кадпросмоторщики.. Да, у меня было два СВ-сервера с сиквельной базой. НО!! постоянно терялась связь с сиквелом и все вставало до ребута служб на СВ-сервере. Плюнул, СВ перенес на кластер. Сейчас переделал все на виртуалках. На каждом железном по два виртуалки, на каждую по 50 пользователей(работает и по 60-на запас) для того чтобы быстро можно было разворачивать и восстанавливать. Потому как с этим 2016 гемора постоянно. То пуск отваливается(починил сейчас чисткой реестра в ветке брандмауэра), то обновление придет и сломает что-то, как было с два последних месяца.. То ПО на самом сервере заглючит. Пользователей теоритически и настроенных 450, но реально постоянно работают 250.  Остальные только периодически все вваливаются.

    Печатать на каждом сервере одинаковые принтеры. Пробовали через политики, очень долго применяет для каждого пользователя принтер, некоторые не появлялись совсем. С зебрами для этикеток совсем была бяда.

    25 января 2018 г. 5:49
  • Раз пошёл обмен мнениями... ИМХО чем меньше сессий на терминальник тем лучше, наша практика - три или четыре виртуалки терминальников на физический хост, средняя нагрузка до 20 сессий. 
    25 января 2018 г. 6:27
  • Возможно 20 сессий и хорошо, но очень уж дорого получается ))) А две укладывается в концепцию стандарта. При 60 юзерах у меня сервера были нагружены по 40% в среднем, что вполне себе вписывается. Хотя.. может есть смысл брать сервера попроще, с одним процессором, но распределять по 20 юзеров. Но опять же.. Е-3 процессоры малоядерные, 4 всего. А все остальное - уже и платформы дороже.

    Да, и коли уж пошел разговор про фермы.. Расскажите, кто нибудь знает безболезненный способ перевода пользователей на другие сервера? Потому что если сервер отключить, то пользователи все равно пытаются попасть на него.

    25 января 2018 г. 6:51
  • Коллеги, спасибо за обмен опытом!

    Оказывается не я один страдал от умирающего меню пуск) а есть какаянибудь статья или какие параметры реестра чистить? Потому что все что попадалось в инете - прям мимо.

    Сегодня запустил четвертый session host, т.к. он слабее по ресурсам(32 ядра\40гб память) выставил ему вес в балансировщике в 40% - пока полет нормальный. Иногда замечаю на первых трех резкие скачки по ЦП, но коротковременные. В предыдущее два дня проблема с ресурсами начинала проявляться с 10 до 11 МСК, сейчас пока стабильно, средняя загрузка по ЦП на серверах - 25-35% 

    Кстати, при добавлении нового сервера в ферму - сертификат перевыпускать надо?


    25 января 2018 г. 7:48
  •  Реестр попробовать почистить так.. Не через regedit, иначе долго ждать придется.  И это в батник и на задание. Эта ветка пополняется.
    REG DELETE HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\SharedAccess\Parameters\FirewallPolicy\RestrictedServices\Configurable\System /f /va


    25 января 2018 г. 7:55