none
Периодическое падение сервера

    Вопрос

  • Здравствуйте!
    Периодически стал "падать" сервер Exchange 2013, CU 17.
    Т.е. сам сервер работает, но почта перестает ходить, и при подключении к консоли EMS появляются такие ошибки:

    ПОДРОБНО: Подключение к MAIL.dom.ru.
    New-PSSession : [MAIL.dom.ru] Сбой подключения к удаленному серверу MAIL.dom.ru. Сообщение об ошибке:
     Отказано в доступе. Подробности см. в разделе справки "about_Remote_Troubleshooting".
    строка:1 знак:1
    + New-PSSession -ConnectionURI "$connectionUri" -ConfigurationName Microsoft.Excha ...
    + ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
        + CategoryInfo          : OpenError: (System.Manageme....RemoteRunspace:RemoteRunspace) [New-PSSession], PSRemotin
       gTransportException
        + FullyQualifiedErrorId : AccessDenied,PSSessionOpenFailed
    ПОДРОБНО: Подключение к MAIL.dom.ru.
    New-PSSession : [MAIL.dom.ru] Сбой подключения к удаленному серверу MAIL.dom.ru. Сообщение об ошибке:
     Отказано в доступе. Подробности см. в разделе справки "about_Remote_Troubleshooting".
    строка:1 знак:1.

    Введите имя FQDN сервера, к которому необходимо подключиться.: MAIL.dom.ru
    ПОДРОБНО: Подключение к MAIL.dom.ru.
    New-PSSession : [MAIL.dom.ru] Сбой подключения к удаленному серверу MAIL.dom.ru. Сообщение об ошибке:
     Отказано в доступе. Подробности см. в разделе справки "about_Remote_Troubleshooting".
    строка:1 знак:1
    + New-PSSession -ConnectionURI "$connectionUri" -ConfigurationName Microsoft.Excha ...
    + ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
        + CategoryInfo          : OpenError: (System.Manageme....RemoteRunspace:RemoteRunspace) [New-PSSession], PSRemotin
       gTransportException
        + FullyQualifiedErrorId : AccessDenied,PSSessionOpenFailed
    [PS] C:\Windows\system32>
    Вроде пересмотрел все логи, но ничего криминального не увидел. Подскажите, куда копать? Система - Win2012R2. Все службы эксченджа на одном сервере. На диске C:\ доступно 9 Гб (вряд ли из-за этого). Лечится обычно перезагрузкой (иногда до 3-4 раз). На домене в логах тоже ничего криминального.

    7 декабря 2017 г. 4:08

Все ответы

  • Если локально консоль на сервере не открывается, я бы в ресурсы копнул бы. Которых может не хватать, поэтому и почтанама пропала и консольнама не подклюююючилааась. Диски не динамические? Память- не динамическая? Пару комментариев от Вас по конфигурации машины, пожалуйста.
    7 декабря 2017 г. 5:53
  • Виртуализация на proxmox 3.4, оперативной памяти - 16 Гб. Диск сделали 2 Тб, из них 100 гб на диск C:\, и нет, не динамическое все.
    Сейчас перенес некоторые логи на D:\, теперь свободно 24 Гб стало.
    Думаете, что ему 9 Гб места мало и он останавливается? Я бы понял, если бы оставался 1 гб хотя бы.
    Оперативы вроде в 2 раза больше рекомендуемой. Но можно и еще добавить.
    7 декабря 2017 г. 6:37
  • Я бы понял, если бы Вы с архитектурой ознакомились бы сперва, прежде чем крутить почту в бою. Все на русском даже есть с качественным переводом. Но нет, как обычно.

    Думаете, что ему 9 Гб места мало и он останавливается? Я бы понял, если бы оставался 1 гб хотя бы.

    Я не думаю, я знаю, что есть такая штука как оценка свободного места на диске в процентах от объема.

    И не нужно здесь думать, что одного гигабайта хватит для всех, ознакомьтесь со статьей, станет яснее.И ее очень просто отловить, эту штуку- если как Вы говорите, встает почта, то можно просто очереди открыть и посмотреть. Чтобы увидеть в них 4.5.2 Если они откроются конечно, поскольку гипервизор Вы выбрали неподдерживаемый.

    Зачем было так делать изначально- загадка.

    7 декабря 2017 г. 6:54
  • Я не думаю, я знаю, что есть такая штука как оценка свободного места на диске в процентах от объема.

    И не нужно здесь думать, что одного гигабайта хватит для всех, ознакомьтесь со статьей, станет яснее.И ее очень просто отловить, эту штуку- если как Вы говорите, встает почта, то можно просто очереди открыть и посмотреть. Чтобы увидеть в них 4.5.2 Если они откроются конечно, поскольку гипервизор Вы выбрали неподдерживаемый.

    Ок, место освободил, посмотрим, как будет себя вести теперь. Как то не думал о процентном соотношении.
    Неподдерживаемый был бы, если бы не работало на нем =). А для каждого сервиса покупать новый сервер и лицензии - денег не хватит.
    Спасибо за наводку!
    7 декабря 2017 г. 7:40
  • Hyper-V и VMware ESXi бесплатные.
    7 декабря 2017 г. 7:54
  • Неподдерживаемый был бы, если бы не работало на нем =).

    Вот тут вы заблуждаетесь. Не поддерживается и не работает - разные вещи.

    Не работает это когда не работает, а вот не поддерживается, это когда вендор не тестировал данную конфигурацию и не даст вам никаких гарантий корректной работы своего ПО и соответственно поддержки.

    7 декабря 2017 г. 10:44
  • Сегодня утром сервер опять встал, т.е. проблема не в свободном месте на ЖД. Ошибка та же. Где можно посмотреть логи Exchange, кроме как в системном журнале?
    8 декабря 2017 г. 0:53
  • Что значит встал? Что произошло? Можете увеличить журналирование.

    Сам сервер доступен, работал, с производительностью были какие-то проблемы?

    Что с другими машинами было в это время?

    Чудес не бывает, и надо определиться с ситуацией, что конкретно происходит. А не пытаться лечить проблему пальцем в небо, добавив диска здесь и памяти там.

    У меня из таких случаев (итс фор ю, Иван, больше а то мало рассказал в прошлый раз) недавний кейс есть где бестолковые администраторы дали машине экса, пользуясь развязанными руками на варе 20 vCPU и 90 RAM. На жалких 500+ ящиков. Что Вы думаете, помогло? Нет, все "все равно тормозило, помогите".

    Поэтому постарайтесь как можно более конкретно описать что случилось с сервером, состояние служб экса, поведение самой машины и прочее. Подключение дисков, всю архитектуру сжато. Я всего этого до сих пор не увидел, до сих пор идет просто обмен мнениями как мне видится.

    И как мне видится, ничего мы и не увидим даже с расширенной диагностикой (раз Вы не видите в стандартных журналах). Посему я бы поглядел в сторону резкой деградации производительности и вследствие этого некорректной работы почтовых служб. Хотя я опять же не знаю, как именно они себя ведут. Ну и слава проксмокс конечно )

    8 декабря 2017 г. 5:02
  • У меня из таких случаев (итс фор ю, Иван, больше а то мало рассказал в прошлый раз) недавний кейс есть где бестолковые администраторы дали машине экса, пользуясь развязанными руками на варе 20 vCPU и 90 RAM. На жалких 500+ ящиков.

    ;)))

    8 декабря 2017 г. 9:06
  • Встал - сам сервак (железка, вирт.машина, и все остальные серверы на ней) работает, все службы завязанные на эксчендж работают, в стандартном журнале пусто. Т.е все внешне выглядит нормально, за исключением того, что почта не ходит с клиентов (надо будет OWA проверить при этом). При перезапуске службы топологии (для одновременного перезапуска всех служб) - тормозится на какой-нибудь, не может запустить.
    По поводу proxmoxa - до этого на нем отработал полгода/год без сбоев, хотя да, не показатель. Сама железка без ошибок.

    "Поэтому постарайтесь как можно более конкретно описать что случилось с сервером, состояние служб экса, поведение самой машины и прочее. Подключение дисков, всю архитектуру сжато."

    В том то и проблема, что все остальное в порядке, нет закономерностей. Иногда сутки работает без сбоя, иногда неделю не беспокоит. Думал мб домен виноват - но на домене все тоже чисто. Журналирование расширю, посмотрим что получится.

    8 декабря 2017 г. 9:36