none
Cluster 共用IP ping 不到 RRS feed

  • 問題

  • Dear All:

     

    兩台Windows 2003 做Cluster
    IP設定如下
    (A)的IP
    172.16.1.1/24、
    (B)的IP
    172.16.1.2/24、
    Cluster 起來後的IP為
    172.16.1.3/24

    Cluster 的sql server使用IP為172.16.1.4/24
    共用名稱為sql

    昨天先把Stand by 的Server B 做Update 後,關機
    再把Active 的Server A 做Update 重開機,
    Server A開起來後,災難就來了,
    我用同網段的server c
    去ping sql,
    但共用的IP竟然ping 不到
    ping sql[172.16.1.4]
    Request time out
    Request time out
    Request time out
    Request time out

    還有我在server c上打arp  -a後
    是有解到172.16.1.4這個IP的physical address
    清arp 後,再ping sql
    依然是Request time out ,但arp 還是解的出來
    (而且172.16.1.3、172.16.1.4兩個IP的physical address 是一樣的)


    另外共用的sql[172.16.1.4]這個IP在Server A本機上是可ping 的到的
    我再把Server B開起來後,把Server B變Active 的機器,
    共用的IP [172.16.1.4]也是ping 不到

    註1:在網路上(同網段)Server A、Server B的原本ip(172.16.1.1、172.16.1.2)都可以從server c 解的到,也ping 的到

    註2: 我也有把Switch 重開機過
    註3:事件檢示器沒發現什麼錯誤訊息..

    請問有那位大大遇過這個問題
    如何解決呢?


     

     

    如圖

    http://aycu35.webshots.com/image/38314/2006230732416621645_rs.jpg

     

     

    2007年12月18日 上午 03:22

解答

  • 你說的是switch 是指switch Hub 嗎?

    如果是的話,是沒影響的。

    因為你之前的情形,看來很像是switch 在兩個port  記住了同一個 mac address,所以

    封包會無法送到這兩台電腦。

     

    你說另一間公司的設定的部分,我就不清楚了,不知道是不是硬體設定的關係?

    2007年12月20日 上午 02:40

所有回覆

  •  

    那請問ping netbios name可以嗎?

    跟172.16.1.3的IP ping的到嗎?

    heartbeat的網卡Netbios over TCP/IP 有關掉了嗎?

     

    2007年12月18日 上午 06:56
  • ping netbions name 時,會帶出IP

    但ping 不到

    ping sql[172.16.1.4]
    Request time out
    Request time out
    Request time out
    Request time out

     

     

    172.16.1.3、172.16.1.4是windows 2003 cluster 程式建立後產生的IP

    都是ping 不到的

     

    在cluster 的active(A) 那一台Server 上,

    ip是172.16.1.1、172.16.1.3、172.16.1.4 在本機上都可ping 的到

    (而且active 那一台ServerA上的sql server 看起來啟動是正常的)

     

    但在其他台server (如ServerC),只能ping 到172.16.1.1

     

    heartbeat的網卡Netbios over TCP/IP 是停用了...

     

     

     

     

     

     

    2007年12月18日 上午 09:17
  • 你好:

    在你的Cluster 兩個node 的機器上先連到一台Hub,再串接到switch 上試試。

    2007年12月19日 上午 02:30
  • 您好:

    這個方法試過了…

    但情形一樣

    是改用一個cisco 的8 port 小switch 來做的

    原本的接Cluster 的兩個node 接上後

    再測試…

     

    另外又在2k3 的cluster 程式上,再建出172.16.1.20的ip測試

    還是ping 不到

     

    發現cluster 建出來的IP才會ping 不到

    ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

     

     

     Lusheng 寫信:

    你好:

    在你的Cluster 兩個node 的機器上先連到一台Hub,再串接到switch 上試試。

     

     

     

    2007年12月19日 上午 04:07
  • 不要用swich 用一般的Hub 。

    不然就是先開一台,再將switch上的ARP cache 清除,試試可以Ping 到 Cluster 的IP 嗎

    2007年12月19日 上午 08:08
  • 現在改用單機作業,cluster 打掉了

    可能找時間再回復cluster 機置了…

    謝謝大大喔

     

    但windows 的cluster 必須用Hub比較好嗎

    現在Hub 不好找耶

     

    重開switch 後,不是就可以讓它重新學習了?

    這種情形,四個多月前也發生一次

    結果兩台server 重灌…

     

     

    另外請問

    我曾遇過有家公司,他的二條 專線做負載平衡

    結果造成每隔一段時間,網路全斷

    後來把連接負載平衡設備的switch 設定每一段時間就清cache

    這個方法會不會產生另的問題啊?

    2007年12月19日 下午 02:51
  • 你說的是switch 是指switch Hub 嗎?

    如果是的話,是沒影響的。

    因為你之前的情形,看來很像是switch 在兩個port  記住了同一個 mac address,所以

    封包會無法送到這兩台電腦。

     

    你說另一間公司的設定的部分,我就不清楚了,不知道是不是硬體設定的關係?

    2007年12月20日 上午 02:40
  • 我同事說

    他也有換過hub 了說,

    一樣

    束手無策…

     

     Lusheng 寫信:

    你說的是switch 是指switch Hub 嗎?

    如果是的話,是沒影響的。

    因為你之前的情形,看來很像是switch 在兩個port  記住了同一個 mac address,所以

    封包會無法送到這兩台電腦。

    2007年12月21日 上午 03:43
  •  

    你的switch 可以設定,那兩個port 不去cache MAC Address 嗎?
    2007年12月21日 上午 06:10