登錄網(wǎng)關(guān)F,執(zhí)行clear arp命令,然后在內(nèi)網(wǎng)中,用IDSCLIENT ping A,結(jié)果可以ping通。
基于兩種猜測的原因解釋:
解釋A:本來由于測試頭的“消極”,是不通的。但網(wǎng)關(guān)F上執(zhí)行了clear arp命令后,網(wǎng)關(guān)F由于ARP地址影射清空,F(xiàn)不知網(wǎng)關(guān)的MAC,會向廣播域發(fā)送ARP包,該包中包含了自己的MAC地址。根據(jù)RFC826,雖然廣播域中的機器不會回應(yīng)此包,但會將F的MAC地址記錄到ARP緩存中,所以能使得本不通的112CLIENT pingA能ping通。
解釋B:網(wǎng)關(guān)F上執(zhí)行了clear arp命令后,網(wǎng)關(guān)F由于ARP地址映射清空,F(xiàn)不知網(wǎng)關(guān)的MAC,會向廣播域發(fā)送ARP包,該包中包含了自己的MAC地址。測試頭A上連的交換機會將F的MAC地址和相關(guān)端口綁定;A回應(yīng)此ARP請求時,交換機又會將NPORT測試頭A的MAC地址與相關(guān)端口綁定。所以后續(xù)的連接能通。
針對現(xiàn)象四:“用DCN內(nèi)機器telnet 134.100.200.10(測試頭B),再用B來ping 10.0.2.70(測試頭A),能ping通。再用112CLIENT ping A,能ping通。”
測試動作四:
用內(nèi)網(wǎng)機器IDSCLIENT telnet 到134.100.5.66,然后從134.100.5.66上ping 測試頭B,結(jié)果本來ping不通的,現(xiàn)在可以ping通了。
基于兩種猜測的原因解釋:
解釋A:此現(xiàn)象用猜測A解釋不了。
解釋B:測試頭B向測試頭A ping時,先會發(fā)ARP廣播,測試頭B回應(yīng)此ARP請求。這個過程中,A上連的交換機會將A<->相應(yīng)端口,B<->相應(yīng)端口的記錄記在地址端口映射表。
所以F到A的包就能通了。
至此,可以排除猜測A。同時,由于同一批次的NPORT測試頭在其他地區(qū)及內(nèi)網(wǎng)用的比較正常,所以,傾向于猜測B。為進一步證實猜測B,進一步做了以下測試。
做動作一的時候,在交換機與A間抓包。看是否有源地址為F的物理地址,目的地址為A的物理地址的包從交換機端口出來,結(jié)果確實無包被監(jiān)聽到,所以,從理論上得出,猜測B是正確的。從理論上定位出正確的故障原因后,我們理直氣壯的聯(lián)系數(shù)據(jù)部門,請他們修改了部分交換機的ARP失效時間。經(jīng)過一段時間的檢驗,系統(tǒng)運行良好,原有故障消失。
本次排障工作中,我們堅持理論指導(dǎo)實踐,對每種可能的故障原因進行不偏不倚的分析,在客觀公正不帶主觀臆想的前提下,對每種觀點進行逐步考察,終于確定故障點,解決了問題。