none
Внезапный перезапуск MS SQL Server 2005 в кластере RRS feed

  • Вопрос

  • Всем привет!

    Есть следующая конфигурация: двухузловой кластер Win2K3 EE SP2 на котором развернут MS SQL Server 2005 Standart SP3. Клиентом MS SQL Server является 1С УПП 8.1 (два сервера предприятия).

    Все это работает с 2007-го года и (тьфу-тьфу-тьфу) особо не доставляет проблем. Но вот сегодня произошел странный сбой (не сказать чтобы это особо напрягло, но разобраться в его причине мне самому интересно).

    В 8.19 утра неожиданно задумалась 1C УПП, через пару минут все восстановилось. Зашел на кластер и обнаружил, что группы MS SQL Server и MS DTC перезапустились на другом узле, а в системном логе ошибка:

    ----------------------

    Event ID: 1069

    Source: ClusSvc

    Описание:

    Ошибка кластерного ресурса "SQL Server" в группе ресурсов "MS SQL Server 2005".

    -----------------

    Начал смотреть лог SQL и обнаружил вот что:

    -----------------

    08/30/2011 08:21:04,MSSQLSERVER,Information,Microsoft SQL Server 2005 - 9.00.4053.00 (X64)
     May 26 2009 14:13:01
     Copyright (c) 1988-2005 Microsoft Corporation
     Standard Edition (64-bit) on Windows NT 5.2 (Build 3790: Service Pack 2),Server,1073758893,,DIS2
    08/30/2011 08:21:02,spid6s,Unknown,SQL Trace was stopped due to server shutdown. Trace ID = '1'. This is an informational message only; no user action is required.,,,,
    08/30/2011 08:21:02,spid6s,Unknown,SQL Server is terminating in response to a 'stop' request from Service Control Manager. This is an informational message only. No user action is required.,,,,
    08/30/2011 08:21:02,MSSQLSERVER,Information,SQL Trace was stopped due to server shutdown. Trace ID = '1'. This is an informational message only; no user action is required.,Server,1073760856,,DIS2
    08/30/2011 08:21:02,MSSQLSERVER,Information,SQL Server is terminating in response to a 'stop' request from Service Control Manager. This is an informational message only. No user action is required.,Server,1073758972,,DIS2
    08/30/2011 08:21:00,Logon,Unknown,Login failed for user '1CUPP_db'. Only administrators may connect at this time. [CLIENT: 192.168.xxx.xxx],,,,
    08/30/2011 08:21:00,Logon,Unknown,Error: 18451<c/> Severity: 14<c/> State: 1.,,,,

    .......

    08/30/2011 08:20:23,MSSQLSERVER,Information,Login failed for user '1CUPP_db'. Only administrators may connect at this time. [CLIENT: 192.168.xxx.xxx],Logon,3221243923,,SQLSERVER
    08/30/2011 08:20:23,MSSQLSERVER,Information,Login failed for user '1CUPP_db'. Only administrators may connect at this time. [CLIENT: 192.168.xxx.xxx],Logon,3221243923,,SQLSERVER
    08/30/2011 08:20:16,spid123,Unknown,Configuration option 'show advanced options' changed from 1 to 0. Run the RECONFIGURE statement to install.,,,,
    08/30/2011 08:20:16,,Information,[098] SQLServerAgent terminated (normally),,,,
    08/30/2011 08:20:16,MSSQLSERVER,Information,[sqsrvres] OnlineThread: asked to terminate while waiting for QP.,Failover,1073760843,,NODE2
    08/30/2011 08:20:16,SQLSERVERAGENT,Information,SQLServerAgent service successfully stopped.,Service Control,1073741926,,SQLSERVER
    08/30/2011 08:20:16,MSSQLSERVER,Information,Configuration option 'show advanced options' changed from 1 to 0. Run the RECONFIGURE statement to install.,Server,1073757281,DOMAIN\sqlserver,SQLSERVER
    08/30/2011 08:20:15,spid123,Unknown,Configuration option 'Agent XPs' changed from 1 to 0. Run the RECONFIGURE statement to install.,,,,
    08/30/2011 08:20:15,spid123,Unknown,Configuration option 'show advanced options' changed from 0 to 1. Run the RECONFIGURE statement to install.,,,,
    08/30/2011 08:20:15,MSSQLSERVER,Information,Configuration option 'Agent XPs' changed from 1 to 0. Run the RECONFIGURE statement to install.,Server,1073757281,DOMAIN\sqlserver,SQLSERVER
    08/30/2011 08:20:15,MSSQLSERVER,Information,Configuration option 'show advanced options' changed from 0 to 1. Run the RECONFIGURE statement to install.,Server,1073757281,DOMAIN\sqlserver,SQLSERVER
    08/30/2011 08:19:47,,Information,[131] SQLSERVERAGENT service stopping due to a stop request from a user<c/> process<c/> or the OS...,,,,
    08/30/2011 08:19:47,MSSQLSERVER,Error,[sqsrvres] OnlineThread: QP is not online.,Failover,1073760843,,NODE2
    08/30/2011 08:19:47,MSSQLSERVER,Error,[sqsrvres] printODBCError: sqlstate = HYT00; native error = 0; message = [Microsoft][SQL Native Client]Query timeout expired,Failover,1073760843,,NODE2
    08/30/2011 08:19:47,MSSQLSERVER,Error,[sqsrvres] CheckQueryProcessorAlive: sqlexecdirect failed,Failover,1073760843,,NODE2

    ----------------------

    Поскольку я к сожалению не являюсь большим специалистом по MS SQL Server хочу спросить: это нормально что свойство Agent XPs меняется на лету учеткой, от которой работает SQL Server ? И почему данное изменение (ну или что-то другое) привело к его падению ? 


    Andy Mishechkin
    30 августа 2011 г. 8:28

Ответы

Все ответы

  • Это нормально и это не причина перезапуска. Причину ищите в системных журналах с акцентам на кластерные ресурсы.

    31 августа 2011 г. 18:42
  • Это нормально и это не причина перезапуска. Причину ищите в системных журналах с акцентам на кластерные ресурсы.


    В системных журналах ничего кроме приведенного Event ID: 1069 нет. В \Windows\Cluster\cluster.log тоже в это время криминала не наблюдается.
    В 17.35 судя по логам сбой повторился, правда на это раз уже без переезда SQL на другой узел:

    08/30/2011 17:35:57,Server,Unknown,All rights reserved.,
    08/30/2011 17:35:57,Server,Unknown,(c) 2005 Microsoft Corporation.,
    08/30/2011 17:35:57,Server,Unknown,Microsoft SQL Server 2005 - 9.00.4053.00 (X64) <nl/> May 26 2009 14:13:01 <nl/> Copyright (c) 1988-2005 Microsoft Corporation<nl/> Standard Edition (64-bit) on Windows NT 5.2 (Build 3790: Service Pack 2),
    08/30/2011 17:35:53,spid7s,Unknown,SQL Trace was stopped due to server shutdown. Trace ID = '1'. This is an informational message only; no user action is required.,
    08/30/2011 17:35:53,spid7s,Unknown,SQL Server is terminating in response to a 'stop' request from Service Control Manager. This is an informational message only. No user action is required.,
    08/30/2011 17:35:46,spid14s,Unknown,Service Broker manager has shut down.,
    08/30/2011 17:35:33,,Warning,[098] SQLServerAgent terminated (forcefully),
    08/30/2011 17:35:32,spid56,Unknown,Configuration option 'show advanced options' changed from 1 to 0. Run the RECONFIGURE statement to install.,
    08/30/2011 17:35:32,spid56,Unknown,Configuration option 'Agent XPs' changed from 1 to 0. Run the RECONFIGURE statement to install.,
    08/30/2011 17:35:32,spid56,Unknown,Configuration option 'show advanced options' changed from 0 to 1. Run the RECONFIGURE statement to install.,
    08/30/2011 17:35:28,,Warning,[188] Scheduler engine timed out (after 15 seconds) waiting for 2 jobs(s) to stop,
    08/30/2011 17:35:14,Backup,Unknown,BACKUP failed to complete the command BACKUP DATABASE UPP2. Check the backup application log for detailed messages.,
    08/30/2011 17:35:14,Backup,Unknown,Error: 3041<c/> Severity: 16<c/> State: 1.,
    08/30/2011 17:35:13,Backup,Unknown,BACKUP failed to complete the command BACKUP DATABASE 1СUPP_db. Check the backup application log for detailed messages.,
    08/30/2011 17:35:13,Backup,Unknown,Error: 3041<c/> Severity: 16<c/> State: 1.,
    08/30/2011 17:35:12,,Information,[131] SQLSERVERAGENT service stopping due to a stop request from a user<c/> process<c/> or the OS...,


    Andy Mishechkin
    1 сентября 2011 г. 19:43
  • Перевести группу на другой узел можно и вручную. Настораживает следующий текст: ",,Information,[131] SQLSERVERAGENT service stopping due to a stop request from a user<c/> process<c/> or the OS..."

    2 сентября 2011 г. 6:30