Спрашивающий
Зависает сервер с Exchange 2013

Общие обсуждения
-
Добрый день уважаемые!
Мучается сервер давольно продолжительное время и никак не можем его вылечить.
Есть Windows Server 2012R2 с установленным Exchange 2013 Version 15.0 (Build 1263.5)
Аппаратная часть однопроцессорная мат плата с Xeon E3, 32 Гб ОЗУ, RAID Adaptec 6805, 6 SAS в RAID 6.
Проблема: Примерно каждые 2-3 недели сервер зависает, перестает работать почта, не пускает по rdp, в IPMI пишет NO SIGNAL, при этом пинг на сервер есть.
Приходиться делать Power Reset через моуль IPMI.
Что делалось:
Замена RAID контроллера с перепрошивкой и обновлением драйверов, замена ОЗУ, замена блока питания на сервера, обновление BIOS, BMC, IMPI. В логах системы ничего конкретного.
Вот собственно ситуация.
31 марта 2018 г. 7:49
Все ответы
-
Проблема: Примерно каждые 2-3 недели сервер зависает, перестает работать почта, не пускает по rdp, в IPMI пишет NO SIGNAL, при этом пинг на сервер есть.
Добрый день.
Это физический сервер, не гипервизор?
31 марта 2018 г. 7:58 -
Добрый День.
Как вариант смотреть в сторону cpu и MoterBoard, если конечно проблемный сервер не VM
Я не волшебник, я только учусь MCP CCNA. Если Вам помог чей-либо ответ, пожалуйста, не забывайте жать на кнопку "Пометить как ответ" или проголосовать "полезное сообщение". Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции работодателя. Вся информация предоставляется как есть без каких-либо гарантий. Блог IT Инженера, Twitter, YouTube, GitHub.
31 марта 2018 г. 18:08Модератор -
Это физический сервер, не виртуальная машина.1 апреля 2018 г. 8:02
-
Это физический сервер, не виртуальная машина.
Добрый День.
Хорошо, вы визуально осматривали Материнскую плату, цпу, мониторили температуру коих в IPMI ?
Я не волшебник, я только учусь MCP CCNA. Если Вам помог чей-либо ответ, пожалуйста, не забывайте жать на кнопку "Пометить как ответ" или проголосовать "полезное сообщение". Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции работодателя. Вся информация предоставляется как есть без каких-либо гарантий. Блог IT Инженера, Twitter, YouTube, GitHub.
1 апреля 2018 г. 8:07Модератор -
Это физический сервер, не виртуальная машина.
Добрый День.
Хорошо, вы визуально осматривали Материнскую плату, цпу, мониторили температуру коих в IPMI ?
Я не волшебник, я только учусь MCP CCNA. Если Вам помог чей-либо ответ, пожалуйста, не забывайте жать на кнопку "Пометить как ответ" или проголосовать "полезное сообщение". Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции работодателя. Вся информация предоставляется как есть без каких-либо гарантий. Блог IT Инженера, Twitter, YouTube, GitHub.
На вид с материнской платой все в порядке. По логам ipmi так же все хорошо. Температура в норме.
Думаете плата? Но почему пинги ходят на сервер?
1 апреля 2018 г. 12:39 -
Это физический сервер, не виртуальная машина.
Добрый День.
Хорошо, вы визуально осматривали Материнскую плату, цпу, мониторили температуру коих в IPMI ?
Я не волшебник, я только учусь MCP CCNA. Если Вам помог чей-либо ответ, пожалуйста, не забывайте жать на кнопку "Пометить как ответ" или проголосовать "полезное сообщение". Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции работодателя. Вся информация предоставляется как есть без каких-либо гарантий. Блог IT Инженера, Twitter, YouTube, GitHub.
На вид с материнской платой все в порядке. По логам ipmi так же все хорошо. Температура в норме.
Думаете плата? Но почему пинги ходят на сервер?
Добрый День.
IPMI порт выделенный или совмещенный ?
Я не волшебник, я только учусь MCP CCNA. Если Вам помог чей-либо ответ, пожалуйста, не забывайте жать на кнопку "Пометить как ответ" или проголосовать "полезное сообщение". Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции работодателя. Вся информация предоставляется как есть без каких-либо гарантий. Блог IT Инженера, Twitter, YouTube, GitHub.
1 апреля 2018 г. 14:02Модератор -
Это физический сервер, не виртуальная машина.
Добрый День.
Хорошо, вы визуально осматривали Материнскую плату, цпу, мониторили температуру коих в IPMI ?
Я не волшебник, я только учусь MCP CCNA. Если Вам помог чей-либо ответ, пожалуйста, не забывайте жать на кнопку "Пометить как ответ" или проголосовать "полезное сообщение". Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции работодателя. Вся информация предоставляется как есть без каких-либо гарантий. Блог IT Инженера, Twitter, YouTube, GitHub.
На вид с материнской платой все в порядке. По логам ipmi так же все хорошо. Температура в норме.
Думаете плата? Но почему пинги ходят на сервер?
Добрый День.
IPMI порт выделенный или совмещенный ?
Я не волшебник, я только учусь MCP CCNA. Если Вам помог чей-либо ответ, пожалуйста, не забывайте жать на кнопку "Пометить как ответ" или проголосовать "полезное сообщение". Мнения, высказанные здесь, являются отражением моих личных взглядов, а не позиции работодателя. Вся информация предоставляется как есть без каких-либо гарантий. Блог IT Инженера, Twitter, YouTube, GitHub.
1 апреля 2018 г. 14:59 -
Думаете плата? Но почему пинги ходят на сервер?
А почему он по IMPI недоступен при этом?
Что-то не в порядке с железом очевидно, так работать сервер не должен.
Можно было бы списать это поведение на Windows, к примеру, какое-то обновление, все пропало и зависло. Но Вы бы тогда спокойно зашли бы по IMPI и увидели бы что машина зависла и не реагирует.
Меняйте комплектующие дальше, что тут посоветовать. Если это не единственный Ваш сервер, то я бы предложил бы использовать ВМ с Exchnage на время того, как Вы разбираетесь с проблемой. Перенесли бы ее на другой хот и горя бы не знали. И еще, вдобавок
SAS в RAID 6.
Сомнительная конфигурация для почтового сервера. Если он в организации один, то никакой рейд ему не нужен, т.к. любой рейд может развалиться. Нужен просто правильный бэкап, и надеюсь он у Вас настроен. А Exchnage с 2010 версии поддерживает локальные диски, для справки.
2 апреля 2018 г. 4:08 -
Думаете плата? Но почему пинги ходят на сервер?
А почему он по IMPI недоступен при этом?
Что-то не в порядке с железом очевидно, так работать сервер не должен.
Можно было бы списать это поведение на Windows, к примеру, какое-то обновление, все пропало и зависло. Но Вы бы тогда спокойно зашли бы по IMPI и увидели бы что машина зависла и не реагирует.
Меняйте комплектующие дальше, что тут посоветовать. Если это не единственный Ваш сервер, то я бы предложил бы использовать ВМ с Exchnage на время того, как Вы разбираетесь с проблемой. Перенесли бы ее на другой хот и горя бы не знали. И еще, вдобавок
SAS в RAID 6.
Сомнительная конфигурация для почтового сервера. Если он в организации один, то никакой рейд ему не нужен, т.к. любой рейд может развалиться. Нужен просто правильный бэкап, и надеюсь он у Вас настроен. А Exchnage с 2010 версии поддерживает локальные диски, для справки.
Да, думаю, попробовать заменить мат плату.
IPMI при зависшем сервере работает, только не полноценно. Через него я могу перезапустить сервер, выключить, но на основном экране NO SIGNAL.
Сервер один, да я понимаю, что это не правильно, нужно виртуализировать и добавлять еще один сервер.
Нет опыта и знаний в этом вопросе.
Бэкап реализован через стандартный Windows Backup на отдельный диск.
2 апреля 2018 г. 9:40 -
Тут я посмотрел на сервер во время процедуры резервного копирования.
Она запускается в 2 ночи каждый день. Бэкап посредствам Windows Backup делается на отдельный диск.
Так вот подключаюсь я к серверу спустя мин 15 после старта резервного копирования, вижу в IPMI экран входа, но время на нем старое и на нажатие CTRL+ALT+DELETE не отвечает.
Складывается впечатление, что процедура резервного копирования вешает сервер.
Не понятно, что я делаю не так. Каким образом бэкапить Exchange ?
Да, для баз данных есть время для обслуживания. Может необходимо разность в разное время данные процедуры?
Или все же это проблемы с железом и не должна процедура резервного копирования так вешать сервер.
3 апреля 2018 г. 23:30 -
Самое главное- восьмой пункт. Ну, иначе логи не проигрывались, думаю он настроен у Вас.
Да, для баз данных есть время для обслуживания. Может необходимо разность в разное время данные процедуры?
Нет, для производительности сервера это ни на что не влияет.
Она запускается в 2 ночи каждый день. Бэкап посредствам Windows Backup делается на отдельный диск.
Так вот подключаюсь я к серверу спустя мин 15 после старта резервного копирования, вижу в IPMI экран входа, но время на нем старое и на нажатие CTRL+ALT+DELETE не отвечает.
Не бачу логики. Вы же в первом сообщении говорите, что зависание происходит раз в две недели, так?
4 апреля 2018 г. 3:55 -
Да, включен полный бэкап.
С обслуживанием баз понятно.
Да, обычно сервер работает около двух недель. Но вчера это произошло гораздо раньше.
Не знаю, совпало так, что я вчера это увидел. Я не знаю, может спустя несколько часов он отвисет, после того, как проходит бэкап, да и то не всегда.
Да, еще заметил такую вещь, каждую ночь вылетает ошибка отправки получения (есть одна раб станция, на которой настроен MS Outlook на pop3/smtp)
Я эту ошибку вижу утром, провожу проверку почты и все проходит без ошибок. Т.е. получается каждую ночь во время бэкапа сервер недоступен и к утру это проходит само собой без перезагрузок сервера.
4 апреля 2018 г. 5:20 -
Во время работы резервного копирования сервер действительно может слегка подвисать и подтормаживать, это вполне нормально и хорошо заметно, если Вы, к примеру работаете на нем в RDP сессии. Можете увидеть визуально это. Не забываем, что у нас есть прекрасная штука как perfmon, и счетчики производительности. Посмотрите что по ним происходит и ночью и днем, изучите данные обращения к диску и очередь к диску.4 апреля 2018 г. 5:58
-
Во время работы резервного копирования сервер действительно может слегка подвисать и подтормаживать, это вполне нормально и хорошо заметно, если Вы, к примеру работаете на нем в RDP сессии. Можете увидеть визуально это. Не забываем, что у нас есть прекрасная штука как perfmon, и счетчики производительности. Посмотрите что по ним происходит и ночью и днем, изучите данные обращения к диску и очередь к диску.
Да, я понимаю, что сервер будет подвисать, это нормально. Но он вообще умирает, я не могу подключиться по rdp, по IPMI, Exchange перестает функционировать, собственно перестает работать сам сервер.
Спасибо, посмотрю perfmon на предмет использования дисковой подсистемы.
4 апреля 2018 г. 6:22 -
У вас есть средство мониторинга? С помощью того же Zabbix, SCOM можете в течении ночи отследить нагрузку, просадку по производительности (если она имеет место быть). Зафиксируйте это время, сравните с логами на сервере в этот момент. Подключите вендора к проблеме - возможно он тоже что-то посоветует (обычно обновить прошивку или поменять комплектующие).4 апреля 2018 г. 6:24