none
Ошибка при выполнении операции резервного копирования на сетевой ресурс RRS feed

  • Вопрос

  • Добрый день, коллеги!

    В компании имеется несколько SQL серверов (SQL 2008 Standard 10.50.1600.1). Все располагаются в разных местах. Общих сетей между ними нет.

    Каждый день с SQL-сервера запускается задания на полный бэкап базы на сетевой ресурс (другой сервер). Объем базы (в зависимости от сервера) - от 3 до 11 Гб. С недавнего времени появилась проблема. Задание завершается с ошибкой:

    "Операционная система вернула ошибку "64(Указанное сетевое имя более недоступно.)" при попытке выполнить "FlushFileBuffers"

    Ошибка возникает только при сетевом копировании.

    Выполнил рекомендации отсюда

    Не помогает. Точнее, раз на раз не приходится. Вчера, допустим, бэкап прошел. Сегодня - нет.

    Хочу сразу отметить, что я не SQL-администратор. И все возможные рекомендации прошу объяснять по простому :)

    ОС на сервере SQL - Windows 2008 Standard x86

    ОС на сервере-получателе бэкапа - Windows 2003 Standard x86

    Модель восстановления базы - простая.

    Подскажите, как можно устранить проблему ?

    16 января 2014 г. 6:40

Ответы

Все ответы

  • Если раз на раз не приходится, то логично предположить, что проблема в удалённом ресурсе или самой сети.  Делайте бекап локально, а потом уже переносите его на ваш сетевой ресурс. 
    16 января 2014 г. 7:35
  • "Делайте бекап локально, а потом уже переносите его на ваш сетевой ресурс" - не ответ. Проблема появилась внезапно, не в одно и то же время, на разных серверах. Изменений в оборудовании не происходило.

    Хочется найти решение именно этой проблемы

    16 января 2014 г. 7:40
  • Хочется найти решение именно этой проблемы

    Проблема не в SQL Server, а в вашей инфраструктуре...разбирайтесь с сетевым оборудованием.

    ERROR_NETNAME_DELETED
    64
    The specified network name is no longer available.


    http://www.t-sql.ru

    16 января 2014 г. 8:32
    Отвечающий
  • Вы напрасно считаете, что это не ответ. Бекапы делаются не по велению левой пятки, а ради обеспечения сохранности данных. Бизнес совершенно не интересует,  почему именно бекапа нет. Если вы потеряете данные из-за того, что у вас сеть по ночам падает не по вашей вине, то больно и обидно будет примерно так же, как и в ситуации, когда виноваты только вы.  Бекап на локальный диск убивает двух зайцев:
    1) У вас всё-таки есть бекап. И это самое главное.
    2) Вы частично локализуете проблему. Это необходимо для дальнейшего анализа. 

    16 января 2014 г. 11:51
  • Роман, я прекрасно понимаю, что бэкап нужно иметь в любом случае, независимо от того, проблемы с сетью ли, с сервером ли или с отключением света в городе. И бэкап имеется. И его актуальность также поддерживается и сверяется регулярно. Однако, в теме был поднят вопрос не о том, как еще сделать бэкап, а об исправлении ситуации, которая, как я считаю, связана не с сетью, а с сетевыми интерфейсами, причем, как мне кажется, сервера базы данных. И в данном ключе, ответ "делайте бэкап локально" бесполезен.

    Аналитическим путем было выяснено, что в какой-то (пока для меня произвольный) момент времени сервер базы данных отправляет больше данных, чем может принять сервер-получатель. Если смотреть на график загрузки сетевого интерфейса (через TaskManager), то можно наблюдать сначала почти полную загрузку интерфейса (порядка 90%). Потом, через какое-то время график загрузки падает до 0,5-1%.. Но бэкап все еще идет. И в этот момент задание может завершится с ошибкой, а может - продолжить выполнение. Если продолжит, то через какое-то время процент загрузки интерфейса снова поднимется до 90%.

    Скорости на интерфейсах были как в режиме автоматического определения, так и в "жестко" установленных рамках. (100 FD, 100 HD, 10 FD, 10 HD).. Эффекта нет.

    16 января 2014 г. 12:41
  • Ещё раз. Бекап, сделанный локально, может быть отправлен на сетевой ресурс. Если вы это делаете, проблемы есть или нет? Если нет, попробуйте разные сценарии загрузки( разные credentials и способы копирования(shell, file managers, copy). Если получится воспроизвести проблему, то вы сможете исключить влияние mssql, которое, судя по всему, предполагается, раз уж вы вопрос в соответствующем подфоруме задаёте. 
    Проблема в том, что у проблемы может быть миллион инфраструктурных причин. Это проблематично диагностировать удалённо.
    16 января 2014 г. 14:09
  • Привет!

    С Романом совершенно согласен.

    Для решения изначальной проблемы (если предположение автора верно, и проблема действительно не с сетью, а на стороне сервера) я бы попробовал следующее (выполняется на двух серверах с обеих сторон):

    1. Выполните следующие команды от имени администратора

    netsh int ip set global taskoffload=disabled
    netsh interface tcp set global chimney=disabled
    netsh interface tcp set global rss=disabled 
    netsh interface tcp set global autotuning=disabled

    2. Перейдите к ключу HKLM\System\CurrentControlSet\Control\Class\{4D36E972-E325-11CE-BFC1-08002BE10318}.

    3. Обращаю Ваше внимание, что следующие действия выполняются для всех физических адаптеров

    There will be folders with four digits, starting with '0000'. Locate the ones that show the physical NIC names on the right. For each of these disable All Vendor specific Offloading. Set values for any entries below that include the word 'Offload' to '0' (Disabled)

    *IPChecksumOffloadIPv4 
    Describes whether the device enabled or disabled the calculation of IPv4 checksums.
    *TCPChecksumOffloadIPv4 
    Describes whether the device enabled or disabled the calculation of TCP Checksum over IPv4 packets.
    *TCPChecksumOffloadIPv6 
    Describes whether the device enabled or disabled the calculation of TCP checksum over IPv6 packets. 
    *UDPChecksumOffloadIPv4 
    Describes whether the device enabled or disabled the calculation of UDP Checksum over IPv4 packets.
    *UDPChecksumOffloadIPv6 
    Describes whether the device enabled or disabled the calculation of UDP Checksum over IPv6 packets.
    *LsoV1IPv4 
    Describes whether the device enabled or disabled the segmentation of large TCP packets over IPv4 for large send offload version 1 (LSOv1). 
    *LsoV2IPv4 
    Describes whether the device enabled or disabled the segmentation of large TCP packets over IPv4 for large send offload version 2 (LSOv2). 
    *LsoV2IPv6 
    Describes whether the device enabled or disabled the segmentation of large TCP packets over IPv6 for large send offload version 2 (LSOv2). 
    *IPsecOffloadV1IPv4 
    Describes whether the device enabled or disabled the calculation of IPsec headers over IPv4. 
    *IPsecOffloadV2 
    Describes whether the device enabled or disabled IPsec offload version 2 (IPsecOV2). IPsecOV2 provides support for additional crypto-algorithms, IPv6, and co-existence with large send offload version 2 (LSOv2). 
    *IPsecOffloadV2IPv4 
    Describes whether the device enabled or disabled IPsecOV2 for IPv4 only. 
    *RSS
    Receive side scaling
    *TCPUDPChecksumOffloadIPv4 
    Describes whether the device enabled or disabled the calculation of TCP or UDP checksum over IPv4. 
    *TCPUDPChecksumOffloadIPv6 
    Describes whether the device enabled or disabled the calculation of TCP or UDP checksum over IPv6.

    Часть указанных параметров может отсутствовать. Это нормально.

    4. Перезагрузите сервер.


    Понравился ответ - лайкни!

    16 января 2014 г. 14:31
  • Добрый день, коллеги.
    Выполнил указанные Вами рекомендации на серверах. Проблема осталась, к сожалению...
    6 февраля 2014 г. 6:36
  • А вручную копирование локального бекапа проходит?
    6 февраля 2014 г. 14:40
  • Сформулирую так. Скопировать вручную у меня получится 100%. Но вот сколько времени этот процесс может занять на одном и том же файле бэкапы - предсказать я не могу. Может быть 7 минут, может, 17 минут, может быть 30 минут, а может и 23.

    Ради интереса вчера пробовал. Запускал задание на бэкап до тех пор, пока он не покажет статус "Выполнено". Как в той сказке: "Нажал один раз - вытащил "Ошибку" через 5 минут. Нажал второй раз - вытащил "Ошибку" через 13 минут. Нажал в третий раз - вытащил "Ошибку" через 3 минуты. Нажал в четвертый раз - "Выполнено" через 8 минут...

    Логику до сих пор понять не могу.

    7 февраля 2014 г. 7:45