none
Caída Servidor Windows Server 2008 con rol de Terminal Services RRS feed

  • Pregunta

  • Buenos días,

    Tengo un servidor Windows Server 2008, al cual se conectan vía terminal server (escritorio remoto) los usuarios, aproximadamente unos 30 usuarios se conectan diariamente a esa máquina donde trabajan con el correo, sus documentos y el programa ERP, pero aproximadamente una vez a la semana la máquina se degrada hasta el punto de bloquearse y deja de funcionar. La única manera de recuperarla es apagandola mediante botonazo y volverla a encender. El servicio de Administrador de Terminal Server también está totalmente bloqueado. ¿Alguien me podría ayudar?

    Gracias y un saludo.
    lunes, 8 de marzo de 2010 9:19

Respuestas

  • Hola,

    En principio, por los datos que aportas, el servidor parece que está dimensionado para soportar esa carga de trabajo. Me decantaría por el tema comentado en el primer hilo pero para estar seguros habría que planificar unos contadores de rendimiento y ver como evoluciona la memoria no paginada en uso. Por experiencia, me consta que en entornos similares, en este caso con WS2003, -usando un ERP y ofimática, tienen planificado un reinicio nocturno del servidor porque de no hacerlo se encuentran con la experiencia que comentas en tu post inicial.

    Pasos a seguir:
    1. Monitorizar el sistema con el monitor de rendimiento, por ejemplo que guarde valores cada 5 minutos. Sobrará para ver como la memoria no paginada a lo largo del tiempo va aumentando hasta colapsar el servidor.
    2. Puedes plantearte según los resultados de la monitorización y tu política de aplicación de parches/actualizaciones/SP la instalación del SP2 para Windows 2008. En este link, La lista de revisiones para Windows Server 2008 SP2, puedes comprobar los parches incluidos, entre los que se encuentran el 950086, ya comentado en el primer hilo de este post.
    Puedes tener en cuenta estos tips:

    Un poco más de literatura sobre el tema de Memoria No paginada:

    Performance Monitoring Part 4 – Memory Management

    Pushing the Limits of Windows: Paged and Nonpaged Pool


    Esperamos tus comentarios.




    Un saludo,

    Tomas Hidalgo

    Colobora con el foro: Si la respuesta es de utilidad para resolver tu duda/problema, usa la opción "Marcar como repuesta". Otros usuarios con dudas similares -en un futuro- lo agradecerán.

    • Marcado como respuesta msvpersonal miércoles, 10 de marzo de 2010 10:28
    • Desmarcado como respuesta msvpersonal miércoles, 10 de marzo de 2010 10:28
    • Marcado como respuesta Atilla ArrudaModerator jueves, 15 de abril de 2010 14:03
    lunes, 8 de marzo de 2010 20:56
    Moderador
  • Hola,

    En tu primer post sobre este tema nos comentaste las caracteristicas hardware del servidor. ¿Exactamente que marca, modelo y hardware constituye ese equipo?

    Lo comento porque, dado que esto parece un polstergay, y hace tiempo tuve uno similar relacionado con el hard, tal vez vayan por ahí los tiros. En un modelo IBM xseries nos encontramos un caso similar al que comentas. Todo funcionaba bien pero de pronto el servidor se quedaba bloqueado. No habia forma de recuperarlo. Tras darle miles de vueltas comprobamos que a la hora de instalar la controladora de disco (serveRAID) se habia "pinchado" en un determinado slot, donde -según las instrucciones- no estaba "soportada" su instalación. Fue cambiar la Controladora de disco de slot PCI y el equipo ir como la seda. Nos ayudo bastante la monitorización de ciertos valores del servidor a través del monitor de rendimiento, en este caso, comprobarmos que los "Cambios de Contexto en el procesador" eran muy elevandos, casi un orden de magnitud, por encima de los valores que se entendian como normales.

    Espero, que al menos para descartar opciones, te sirvan estos mini-apuntes.

     


    Un saludo,

    Tomas Hidalgo

    Colobora con el foro: Si la respuesta es de utilidad para resolver tu duda/problema, usa la opción "Marcar como repuesta". Otros usuarios con dudas similares -en un futuro- lo agradecerán.

    martes, 13 de abril de 2010 8:28
    Moderador
  • Hola,

    Sería conveniente revisar que a nivel de firmware los servidores Hp estén a último nivel. Entiendo que los equipos tienen instaladas las herramientas de Hp (hp insight manager), y que no reportan ningún error hardware. Si los equipos están en garantía o bajo soporte sería conveniente que abrieses un caso en Soporte de HP. Te solicitarán datos de los servidores e intentarán ver si existe algun problema.

    A nivel software, entiendo que Microsoft posee un servicio de soporte para estos casos. Dependiendo del nivel de soporte que tengas contratado tendrá coste asociado. Tal vez tu partner tecnologíco o tu proveedor hard/soft tambien tenga este tipo de servicios.

     

     


    Un saludo,

    Tomas Hidalgo

    Colobora con el foro: Si la respuesta es de utilidad para resolver tu duda/problema, usa la opción "Marcar como repuesta". Otros usuarios con dudas similares -en un futuro- lo agradecerán.

    martes, 13 de abril de 2010 22:31
    Moderador

Todas las respuestas

  • Hola,

    Los síntomas que comentan tienen toda la pinta de un "Memory Leak", que a lo largo del tiempo te genera el colapso en el servidor.

    Revisa el siguiente link en el que se reporta un problema en WS2008 similar al que comentas, en el que un aumento de la memoria No Paginada en Uso (nonpaged pool memory usage) degrada el equipo.

    A memory leak may occur in the nonpaged pool memory on the Windows Server 2008-based terminal server when you log on to and log off from a Windows Server 2008-based terminal server through an RDP connection
    http://support.microsoft.com/kb/950086/en

    Para saber si verdaderamente tu problema de falta de recursos y colapso del servidor lo provoca un "memory leak" deberías usar, por ejemplo, el Monitor de Rendimiento (perfmon.exe) y mediante una colección de datos ver como evoluciona el uso de recursos a lo largo de la semana. Lo ideal es que lo pongas a guardar datos recién reiniciado el servidor y ver su evoluacion a lo largo de los días. Seguro que "canta" algo!

    Windows Performance Monitor
    http://technet.microsoft.com/en-us/library/cc749249.aspx

    Using Windows Performance Monitor to Baseline a Terminal Server
    http://www.virtualizationadmin.com/articles-tutorials/terminal-services/general/windows-performance-monitor-baseline-terminal-server-part1.html
    http://www.virtualizationadmin.com/articles-tutorials/terminal-services/general/windows-performance-monitor-baseline-terminal-server-part1.html


    Por otro lado,

    • ¿Cual es la configuración hardware del servidor (memoria RAM/procesador/...?
    • ¿Crees que el servidor está bien dimensionado para la carga que soporta?
    • Ese servidor, ¿comparte más roles además del Rol de TS?


    Esperamos tus comentarios.

    Un saludo,

    Tomas Hidalgo

    Colobora con el foro: Si la respuesta es de utilidad para resolver tu duda/problema, usa la opción "Marcar como repuesta". Otros usuarios con dudas similares -en un futuro- lo agradecerán.

    lunes, 8 de marzo de 2010 12:40
    Moderador
  • Hola Tomás,

    Lo primero agradecerte tu respuesta. Intento responderte a tus preguntas:

    1. ¿Cual es la configuración hardware del servidor (memoria RAM/procesador/...?

    Intel Xeon CPU E5430 @ 2.66 GHZ (2 procesadores)
    RAM 16,0 GB. Sistema operativo de 64 bits.
    Windows Server Standard 2008 Service Pack 1


    2. ¿Crees que el servidor está bien dimensionado para la carga que soporta?

    Pienso que si, ya que ni la memoria ni la cpu superan un 75% o un 25% de actividad.


    3. Ese servidor, ¿comparte más roles además del Rol de TS?

    Actúa como servidor de dominio aunque realmente la principal tarea es aceptar las conexiones de los clientes que se conectan via Terminal server a traves de Escritorio remoto. Los usuario tienen en el servidor sus datos, el correo electrónico a través de Outlook y el programa ERP. Cada vez que acceden se carga el perfil del usuario correspondiente. Es cierto que continuamente los usuarios inician y cierran sesiones.

    Espero que te sea de utilidad.

    Saludos.


    lunes, 8 de marzo de 2010 15:32
  • Hola,

    En principio, por los datos que aportas, el servidor parece que está dimensionado para soportar esa carga de trabajo. Me decantaría por el tema comentado en el primer hilo pero para estar seguros habría que planificar unos contadores de rendimiento y ver como evoluciona la memoria no paginada en uso. Por experiencia, me consta que en entornos similares, en este caso con WS2003, -usando un ERP y ofimática, tienen planificado un reinicio nocturno del servidor porque de no hacerlo se encuentran con la experiencia que comentas en tu post inicial.

    Pasos a seguir:
    1. Monitorizar el sistema con el monitor de rendimiento, por ejemplo que guarde valores cada 5 minutos. Sobrará para ver como la memoria no paginada a lo largo del tiempo va aumentando hasta colapsar el servidor.
    2. Puedes plantearte según los resultados de la monitorización y tu política de aplicación de parches/actualizaciones/SP la instalación del SP2 para Windows 2008. En este link, La lista de revisiones para Windows Server 2008 SP2, puedes comprobar los parches incluidos, entre los que se encuentran el 950086, ya comentado en el primer hilo de este post.
    Puedes tener en cuenta estos tips:

    Un poco más de literatura sobre el tema de Memoria No paginada:

    Performance Monitoring Part 4 – Memory Management

    Pushing the Limits of Windows: Paged and Nonpaged Pool


    Esperamos tus comentarios.




    Un saludo,

    Tomas Hidalgo

    Colobora con el foro: Si la respuesta es de utilidad para resolver tu duda/problema, usa la opción "Marcar como repuesta". Otros usuarios con dudas similares -en un futuro- lo agradecerán.

    • Marcado como respuesta msvpersonal miércoles, 10 de marzo de 2010 10:28
    • Desmarcado como respuesta msvpersonal miércoles, 10 de marzo de 2010 10:28
    • Marcado como respuesta Atilla ArrudaModerator jueves, 15 de abril de 2010 14:03
    lunes, 8 de marzo de 2010 20:56
    Moderador
  • Hola Tomás,

    Te contesto a tus preguntas:

    - Cuando el servidor se queda totalmente degradado, ¿aparece algun evento de error en el Visor de Sucesos?
    Eso es lo mas extraño de todo, la degradación es completa y la única manera de volver a reiniciar el sistema es mediante 'botonazo', no deja apagarse ni reiniciar de forma ordenada. Nunca hemos encontrado error alguno en el visor de sucesos.

    - ¿Si tienes un antivirus instalado en el servidor?
    Tenemos el panda instalado sin embargo no parece que los problemas vengan por ahí.

    - El archivo de paginación para Terminal Server en 2008 lo recomiendan de un tamaño de 3 * tamano_RAM
    Tenemos una memoria RAM de 16 Gb, el tamaño de paginación es de 16.681 Mb para las dos unidades que tiene la máquina. Además, tenemos activado la opción Administrar automáticamente el archivo de paginación para todas las unidades. En la unidad C: tenemos un espacio disponible de 29259 Mb y en la unidad D: 43169 Mb disponibles.

    - Monitorizar el sistema con el monitor de rendimiento, por ejemplo que guarde valores cada 5 minutos. Sobrará para ver como la memoria no paginada a lo largo del tiempo va aumentando hasta colapsar el servidor.

    Monitorizo los siguientes valores (promedios):

    Asignaciones de bloques no paginados: 528.318
    Bytes de bloque no paginado: 180.515.758
    Bytes de bloque paginado: 488.528.041

    Gracias.
    miércoles, 10 de marzo de 2010 11:57
  • Hola,

    De nuevo insisto sobre un problema que venimos sufriendo cada dos semanas mas o menos. Tenemos dos máquinas con Terminal Server donde se conectan los usuarios, aproximadamente unos 35 usuarios se conectan diariamente a cada máquina y trabajan con el correo, sus documentos y el programa ERP. Sin embargo, aproximadamente cada dos semanas la máquina se degrada hasta el punto de bloquearse y dejar de funcionar. La única manera de recuperarla es apagandola mediante botonazo y volverla a encender. No permite reiniciarse ni cerrar sesión, además tampoco deja acceder a Mi PC u otras funciones como el Administrador de Terminal Server además es totalmente imposible cerrar las sesiones abiertas de los usuarios. El colapso es absoluto sin causa aparente. Parece que el error siempre ocurre cuando en determinada ocasiones se cierra la sesión de los usuarios. Concretamente, el último colapso se produjo cuando desde el administrador intenté cerrar la sesión desconectada de un usuario, de repente todo dejó de funcionar.

    Indico algunos de los mensajes de error que aparecen en el visor de sucesos una vez se ha reiniciado la máquina:

    El cliente de Servicios de Certificate Server se detuvo.

    El cliente de Servicios de Certificate Server se inició correctamente.

    El Administrador de ventanas de escritorio se cerró con el código (0x40010004)

    Windows detectó que otras aplicaciones o servicios siguen usando el archivo de Registro. El archivo se descargará ahora. Puede las aplicaciones o servicios que lo usen no funcionen correctamente más adelante.

      DETALLE -

      60 user registry handles leaked from \Registry\User\S-1-5-21-2025601494-3914652360-1470815389-1169:

    Process 8156 (\Device\HarddiskVolume1\Program Files (x86)\Microsoft Office\Office12\OUTLOOK.EXE) has opened key \REGISTRY\USER\S-1-5-21-2025601494-3914652360-1470815389-1169

    Process 8156 (\Device\HarddiskVolume1\Program Files (x86)\Microsoft Office\Office12\OUTLOOK.EXE) has opened key \REGISTRY\USER\S-1-5-21-2025601494-3914652360-1470815389-1169\Software\Microsoft\Office\12.0\Outlook

    Process 8156 (\Device\HarddiskVolume1\Program Files (x86)\Microsoft Office\Office12\OUTLOOK.EXE) has opened key \REGISTRY\USER\S-1-5-21-2025601494-3914652360-1470815389-1169\Software\Microsoft\Office\12.0\Outlook

    Las directivas de seguridad se han propagado con una advertencia. 0x534 : No se efectuó ninguna asignación entre los nombres de cuenta y los identificadores de seguridad.

    No se pudo iniciar el Administrador de ventanas de escritorio porque no se está usando un tema compuesto

    La siguiente aplicación finalizó porque no respondía: dwm.exe

    La siguiente aplicación finalizó porque no respondía: OUTLOOK.EXE

    La siguiente aplicación finalizó porque no respondía: explorer.exe

    La siguiente aplicación finalizó porque no respondía: EXCEL.EXE

    Lo mas curioso es que estos mismos errores aparecen en la segunda máquina (para balancear la carga) y nunca se cae, aún teniendo mas carga de usuarios. Se ha descartado error hardware y está actualizada al SP2, además tanto el uso de CPU como de memoria rara vez supera el 5% o 45% respectivamente. La máquina se reinicia diariamente.

    Sé que el problema es muy difícil, pero ¿Alguien sabría que puede estar pasando? ¿Hay alguna manera de contactar con un servicio especializado de Microsoft para estos casos?

    Gracias.

    Nota del moderador: Más información sobre este mismo problema en este link ya tratado anteriormente en este foro.

     

    • Editado Tomas HidalgoModerator martes, 13 de abril de 2010 8:16 Se agrega una nota adicional con un link a más datos sobre este problema.
    • Combinado Tomas HidalgoModerator martes, 13 de abril de 2010 22:34 Se juntan estos dos hilos que corresponden al mismo caso
    jueves, 8 de abril de 2010 10:08
  • msvpersonal,tenes algun evento asociado???

    todo pareceria que se queda sin recursos entonces perdes el control de todo, tenes idea cuantos usuarios concurrentes tenes cuando ocurro el problema?

    Saludos.


    Roberto Di'Lello | MVP DS | http://www.radians.com.ar -- Este mensaje se proporciona "como está" sin garantías de ninguna clase, y no otorga ningún derecho. Ud. asume los riesgos This posting is provided "AS IS" with no warranties, and confer no rights. You assume all risk for your use. --
    lunes, 12 de abril de 2010 17:25
    Moderador
  • Hola Roberto,

     

    El último colapso lo sufrimos ya acabada la jornada de trabajo, aproximadamente había unos 10 usuarios trabajando en ese momento en la máquina cuando durante todo el día suele haber unos 35, se produjo al intentar cerrar la sesión de un usuario. El servidor se reinicia cada noche y tiene el SP2 instalado, aparentemente está bien dimensionada. Sin embargo, el colapso es total, la única manera de reiniciar la máquina es mediante botonazo. No aparece ningún evento que indique lo que ha ocurrido, los mas significativos los escribí mas arriba.

    Todo es bastante extraño.

    Gracias y un saludo.

    martes, 13 de abril de 2010 7:12
  • Hola,

    En tu primer post sobre este tema nos comentaste las caracteristicas hardware del servidor. ¿Exactamente que marca, modelo y hardware constituye ese equipo?

    Lo comento porque, dado que esto parece un polstergay, y hace tiempo tuve uno similar relacionado con el hard, tal vez vayan por ahí los tiros. En un modelo IBM xseries nos encontramos un caso similar al que comentas. Todo funcionaba bien pero de pronto el servidor se quedaba bloqueado. No habia forma de recuperarlo. Tras darle miles de vueltas comprobamos que a la hora de instalar la controladora de disco (serveRAID) se habia "pinchado" en un determinado slot, donde -según las instrucciones- no estaba "soportada" su instalación. Fue cambiar la Controladora de disco de slot PCI y el equipo ir como la seda. Nos ayudo bastante la monitorización de ciertos valores del servidor a través del monitor de rendimiento, en este caso, comprobarmos que los "Cambios de Contexto en el procesador" eran muy elevandos, casi un orden de magnitud, por encima de los valores que se entendian como normales.

    Espero, que al menos para descartar opciones, te sirvan estos mini-apuntes.

     


    Un saludo,

    Tomas Hidalgo

    Colobora con el foro: Si la respuesta es de utilidad para resolver tu duda/problema, usa la opción "Marcar como repuesta". Otros usuarios con dudas similares -en un futuro- lo agradecerán.

    martes, 13 de abril de 2010 8:28
    Moderador
  • Hola Tomás,

    Se trata de tres servidores HP Proliant DL380 G5 Intel Xeon CPU E5430 @2.66 Hz 2.67 Hz Ram a 16 Gb Windows Server Standard SP2 (64 bits) dos de ellos actúan de servidores terminal server donde se conectan los usuarios y el otro es el servidor con los datos de usuarios, el correo y el ERP. Lo mas raro de este caso es que se caen los dos, aunque el TS2 lo hace con bastante mas frecuencia que el TS1, siendo los dos clónicos y teniendo el TS1 mas carga de usuarios, es por eso que descarto algún problema hardware. El equipo con la aplicación y los datos de los usuarios está conectado a un raid de discos aunque este equipo nunca se ha caído. La última caída del TS2 se produjo realizando un cierre de sesión a un usuario desconectado desde el Administrador de Terminal Server.
    Efectivamente es como tú dices, parece un polstergay. ¿que parámetros podría investigar que arrojen algo de luz?

    Si esto no se soluciona, ¿que opciones tengo? ¿podría acudir a algún sitio con personal experto en estos casos?

    Gracias y un saludo.
    martes, 13 de abril de 2010 15:02
  • Hola,

    Sería conveniente revisar que a nivel de firmware los servidores Hp estén a último nivel. Entiendo que los equipos tienen instaladas las herramientas de Hp (hp insight manager), y que no reportan ningún error hardware. Si los equipos están en garantía o bajo soporte sería conveniente que abrieses un caso en Soporte de HP. Te solicitarán datos de los servidores e intentarán ver si existe algun problema.

    A nivel software, entiendo que Microsoft posee un servicio de soporte para estos casos. Dependiendo del nivel de soporte que tengas contratado tendrá coste asociado. Tal vez tu partner tecnologíco o tu proveedor hard/soft tambien tenga este tipo de servicios.

     

     


    Un saludo,

    Tomas Hidalgo

    Colobora con el foro: Si la respuesta es de utilidad para resolver tu duda/problema, usa la opción "Marcar como repuesta". Otros usuarios con dudas similares -en un futuro- lo agradecerán.

    martes, 13 de abril de 2010 22:31
    Moderador