none
Зависает сервер с Exchange 2013 RRS feed

  • Общие обсуждения

  •  Добрый день уважаемые!

    Мучается сервер давольно продолжительное время и никак не можем его вылечить.

    Есть Windows Server 2012R2 с установленным Exchange 2013 Version 15.0 (Build 1263.5)

    Аппаратная часть однопроцессорная мат плата с  Xeon E3, 32 Гб ОЗУ, RAID Adaptec 6805, 6 SAS в RAID 6.

    Проблема: Примерно каждые 2-3 недели сервер зависает, перестает работать почта, не пускает по rdp, в  IPMI пишет NO SIGNAL, при этом пинг на сервер есть.

    Приходиться делать Power Reset через моуль IPMI.

    Что делалось:

    Замена  RAID контроллера с перепрошивкой и обновлением драйверов, замена ОЗУ, замена блока питания на сервера, обновление BIOS, BMC, IMPI.  В логах системы ничего конкретного.

    Вот собственно ситуация.

    31 марта 2018 г. 7:49

Все ответы

  • Проблема: Примерно каждые 2-3 недели сервер зависает, перестает работать почта, не пускает по rdp, в  IPMI пишет NO SIGNAL, при этом пинг на сервер есть.

    Добрый день.

    Это физический сервер, не гипервизор?

    31 марта 2018 г. 7:58
  • Добрый День.

    Как вариант смотреть в сторону cpu и MoterBoard, если конечно проблемный сервер не VM


    Я не волшебник, я только учусь MCP CCNA. Если Вам помог чей-либо ответ, пожалуйста, не забывайте жать на кнопку "Пометить как ответ" или проголосовать "полезное сообщение". Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции работодателя. Вся информация предоставляется как есть без каких-либо гарантий. Блог IT Инженера, Twitter, YouTube, GitHub.

    31 марта 2018 г. 18:08
    Модератор
  • Это физический сервер, не виртуальная машина.
    1 апреля 2018 г. 8:02
  • Это физический сервер, не виртуальная машина.

    Добрый День.

    Хорошо, вы визуально осматривали Материнскую плату, цпу, мониторили температуру коих в  IPMI ?


    Я не волшебник, я только учусь MCP CCNA. Если Вам помог чей-либо ответ, пожалуйста, не забывайте жать на кнопку "Пометить как ответ" или проголосовать "полезное сообщение". Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции работодателя. Вся информация предоставляется как есть без каких-либо гарантий. Блог IT Инженера, Twitter, YouTube, GitHub.

    1 апреля 2018 г. 8:07
    Модератор
  • Это физический сервер, не виртуальная машина.

    Добрый День.

    Хорошо, вы визуально осматривали Материнскую плату, цпу, мониторили температуру коих в  IPMI ?


    Я не волшебник, я только учусь MCP CCNA. Если Вам помог чей-либо ответ, пожалуйста, не забывайте жать на кнопку "Пометить как ответ" или проголосовать "полезное сообщение". Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции работодателя. Вся информация предоставляется как есть без каких-либо гарантий. Блог IT Инженера, Twitter, YouTube, GitHub.

    На вид с материнской платой все в порядке. По логам ipmi так же все хорошо. Температура в норме.

    Думаете плата? Но почему пинги ходят на сервер?


    1 апреля 2018 г. 12:39
  • Это физический сервер, не виртуальная машина.

    Добрый День.

    Хорошо, вы визуально осматривали Материнскую плату, цпу, мониторили температуру коих в  IPMI ?


    Я не волшебник, я только учусь MCP CCNA. Если Вам помог чей-либо ответ, пожалуйста, не забывайте жать на кнопку "Пометить как ответ" или проголосовать "полезное сообщение". Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции работодателя. Вся информация предоставляется как есть без каких-либо гарантий. Блог IT Инженера, Twitter, YouTube, GitHub.

    На вид с материнской платой все в порядке. По логам ipmi так же все хорошо. Температура в норме.

    Думаете плата? Но почему пинги ходят на сервер?


    Добрый День.

    IPMI порт выделенный или совмещенный ?


    Я не волшебник, я только учусь MCP CCNA. Если Вам помог чей-либо ответ, пожалуйста, не забывайте жать на кнопку "Пометить как ответ" или проголосовать "полезное сообщение". Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции работодателя. Вся информация предоставляется как есть без каких-либо гарантий. Блог IT Инженера, Twitter, YouTube, GitHub.

    1 апреля 2018 г. 14:02
    Модератор
  • Это физический сервер, не виртуальная машина.

    Добрый День.

    Хорошо, вы визуально осматривали Материнскую плату, цпу, мониторили температуру коих в  IPMI ?


    Я не волшебник, я только учусь MCP CCNA. Если Вам помог чей-либо ответ, пожалуйста, не забывайте жать на кнопку "Пометить как ответ" или проголосовать "полезное сообщение". Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции работодателя. Вся информация предоставляется как есть без каких-либо гарантий. Блог IT Инженера, Twitter, YouTube, GitHub.

    На вид с материнской платой все в порядке. По логам ipmi так же все хорошо. Температура в норме.

    Думаете плата? Но почему пинги ходят на сервер?


    Добрый День.

    IPMI порт выделенный или совмещенный ?


    Я не волшебник, я только учусь MCP CCNA. Если Вам помог чей-либо ответ, пожалуйста, не забывайте жать на кнопку "Пометить как ответ" или проголосовать "полезное сообщение". Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции работодателя. Вся информация предоставляется как есть без каких-либо гарантий. Блог IT Инженера, Twitter, YouTube, GitHub.

    Выделенный
    1 апреля 2018 г. 14:59
  • Думаете плата? Но почему пинги ходят на сервер?

    А почему он по IMPI недоступен при этом?

    Что-то не в порядке с железом очевидно, так работать сервер не должен.

    Можно было бы списать это поведение на Windows, к примеру, какое-то обновление, все пропало и зависло. Но Вы бы тогда спокойно зашли бы по IMPI и увидели бы что машина зависла и не реагирует.

    Меняйте комплектующие дальше, что тут посоветовать. Если это не единственный Ваш сервер, то я бы предложил бы использовать ВМ с Exchnage на время того, как Вы разбираетесь с проблемой. Перенесли бы ее на другой хот и горя бы не знали. И еще, вдобавок 

    SAS в RAID 6.

    Сомнительная конфигурация для почтового сервера. Если он в организации один, то никакой рейд ему не нужен, т.к. любой рейд может развалиться. Нужен просто правильный бэкап, и надеюсь он у Вас настроен. А Exchnage с 2010 версии поддерживает локальные диски, для справки.

    2 апреля 2018 г. 4:08
  • Думаете плата? Но почему пинги ходят на сервер?

    А почему он по IMPI недоступен при этом?

    Что-то не в порядке с железом очевидно, так работать сервер не должен.

    Можно было бы списать это поведение на Windows, к примеру, какое-то обновление, все пропало и зависло. Но Вы бы тогда спокойно зашли бы по IMPI и увидели бы что машина зависла и не реагирует.

    Меняйте комплектующие дальше, что тут посоветовать. Если это не единственный Ваш сервер, то я бы предложил бы использовать ВМ с Exchnage на время того, как Вы разбираетесь с проблемой. Перенесли бы ее на другой хот и горя бы не знали. И еще, вдобавок 

    SAS в RAID 6.

    Сомнительная конфигурация для почтового сервера. Если он в организации один, то никакой рейд ему не нужен, т.к. любой рейд может развалиться. Нужен просто правильный бэкап, и надеюсь он у Вас настроен. А Exchnage с 2010 версии поддерживает локальные диски, для справки.

    Да, думаю, попробовать заменить мат плату.

    IPMI  при зависшем сервере работает, только не полноценно. Через него я могу перезапустить сервер, выключить, но на основном экране NO SIGNAL.

    Сервер один, да я понимаю, что это не правильно, нужно виртуализировать и добавлять еще один сервер.

    Нет опыта и знаний в этом вопросе.

    Бэкап реализован через стандартный Windows Backup на отдельный диск.

    2 апреля 2018 г. 9:40
  • Тут я посмотрел на сервер во время процедуры резервного копирования.

    Она запускается в 2 ночи каждый день. Бэкап посредствам Windows Backup делается на отдельный диск.

    Так вот подключаюсь я к серверу спустя мин 15 после старта резервного копирования, вижу в  IPMI экран входа, но время на нем старое и на нажатие CTRL+ALT+DELETE  не отвечает.

    Складывается впечатление, что процедура резервного копирования вешает сервер.

    Не понятно, что я делаю не так. Каким образом бэкапить Exchange ?

    Да, для баз данных есть время для обслуживания. Может необходимо разность в разное время данные процедуры?

    Или все же это проблемы с железом и не должна процедура резервного копирования так вешать сервер.

    3 апреля 2018 г. 23:30
  • Самое главное- восьмой пункт. Ну, иначе логи не проигрывались, думаю он настроен у Вас.

    Да, для баз данных есть время для обслуживания. Может необходимо разность в разное время данные процедуры?

    Нет, для производительности сервера это ни на что не влияет.

    Она запускается в 2 ночи каждый день. Бэкап посредствам Windows Backup делается на отдельный диск.

    Так вот подключаюсь я к серверу спустя мин 15 после старта резервного копирования, вижу в  IPMI экран входа, но время на нем старое и на нажатие CTRL+ALT+DELETE  не отвечает.

    Не бачу логики. Вы же в первом сообщении говорите, что зависание происходит раз в две недели, так?

    4 апреля 2018 г. 3:55
  • Да, включен полный бэкап.

    С обслуживанием баз понятно.

    Да, обычно сервер работает около двух недель. Но вчера это произошло гораздо раньше.

    Не знаю, совпало так, что я вчера это увидел. Я не знаю, может спустя несколько часов он отвисет, после того, как проходит бэкап, да и то не всегда.

    Да, еще заметил такую вещь, каждую ночь вылетает ошибка отправки получения (есть одна раб станция, на которой настроен MS Outlook на pop3/smtp) 

    Я эту ошибку вижу утром, провожу проверку почты и все проходит без ошибок. Т.е. получается каждую ночь во время бэкапа сервер недоступен и к утру это проходит само собой без перезагрузок сервера.

    4 апреля 2018 г. 5:20
  • Во время работы резервного копирования сервер действительно может слегка подвисать и подтормаживать, это вполне нормально и хорошо заметно, если Вы, к примеру работаете на нем в RDP сессии. Можете увидеть визуально это. Не забываем, что у нас есть прекрасная штука как perfmon, и счетчики производительности. Посмотрите что по ним происходит и ночью и днем, изучите данные обращения к диску и очередь к диску.
    4 апреля 2018 г. 5:58
  • Во время работы резервного копирования сервер действительно может слегка подвисать и подтормаживать, это вполне нормально и хорошо заметно, если Вы, к примеру работаете на нем в RDP сессии. Можете увидеть визуально это. Не забываем, что у нас есть прекрасная штука как perfmon, и счетчики производительности. Посмотрите что по ним происходит и ночью и днем, изучите данные обращения к диску и очередь к диску.

    Да, я понимаю, что сервер будет подвисать, это нормально. Но он вообще умирает, я не могу подключиться по rdp, по IPMI, Exchange перестает функционировать, собственно перестает работать сам сервер.

    Спасибо, посмотрю perfmon на предмет использования дисковой подсистемы.

    4 апреля 2018 г. 6:22
  • У вас есть средство мониторинга? С помощью того же Zabbix, SCOM можете в течении ночи отследить нагрузку, просадку по производительности (если она имеет место быть). Зафиксируйте это время, сравните с логами на сервере в этот момент. Подключите вендора к проблеме - возможно он тоже что-то посоветует (обычно обновить прошивку или поменять комплектующие).
    4 апреля 2018 г. 6:24