[故障現(xiàn)象]
公司有3C16980A(V2.6)、3C16950(V2.4)、3C16950(V2.6)這幾臺(tái)交換機(jī)堆疊,最近發(fā)現(xiàn)有時(shí)直接連接在堆疊交換機(jī)上的部分客房機(jī)不能聯(lián)網(wǎng)、網(wǎng)上鄰居找不到、通過(guò)網(wǎng)絡(luò)打印機(jī)打印緩慢,需重新啟動(dòng)3C16980A才能恢復(fù)。詢問(wèn)3Com公司后,答復(fù)是堆疊矩陣中的交換機(jī)軟件的版本不同所致,于是購(gòu)買(mǎi)兩臺(tái)新的3C16985B(V2.66)替換舊3C16950,達(dá)到版本一致后,可新的問(wèn)題又出現(xiàn)了,只有連接在堆疊矩陣中Unit 3上的終端不能訪問(wèn)網(wǎng)絡(luò),重啟Unit 3才能恢復(fù)。堆疊順序如下:
3C16980A Unit 1
3C16985B—1 Unit 2
3C16985B—2 Unit 3
3C169850 Unit 4
診斷過(guò)程 對(duì)公司網(wǎng)絡(luò)進(jìn)行了長(zhǎng)達(dá)一周的監(jiān)測(cè),發(fā)現(xiàn)網(wǎng)絡(luò)中存在較多的問(wèn)題,現(xiàn)對(duì)發(fā)現(xiàn)的問(wèn)題的問(wèn)題進(jìn)行如下分析:
觀察方法:通過(guò)監(jiān)控軟件和登錄交換機(jī)查看交換機(jī)上的一些信息,并通過(guò)ping命令來(lái)看交換機(jī)的連通狀態(tài)。
第一次觀察:(第一天 上午10:05)
網(wǎng)絡(luò)結(jié)構(gòu):堆疊環(huán)境中Unitl (3C16980帶一四口堆疊模矩陣),Unit 2(3C16985B—1),Unit3(3C16985B-2),Unit 4(3C16950).
在Unit3上交換機(jī)分配一IP地址為202.199.100.145,堆疊中Unit 3任一端口連接一臺(tái)客戶機(jī),然后在此客戶機(jī)上長(zhǎng)時(shí)間ping任意一臺(tái)主機(jī)的IP地址,一開(kāi)始為正常,后來(lái)屏幕上顯示Request timed out,并發(fā)現(xiàn)Unit 3自動(dòng)重啟兩次,時(shí)間間隔在2min內(nèi)。Unit 3重啟后可ping通,但丟包現(xiàn)象嚴(yán)重,丟包率在30%~50%。
在Unit 4中,重復(fù)上述操作,無(wú)上述現(xiàn)象發(fā)生,將OneTouch接到Unit 3上,Unit 3上接PC A(IP為202.199.100.147),Unit 4接PC B(IP為202.199.100.146)。用OpenTouch對(duì)PC B施加背景流量,并且Unit 4中使用PC B(IP為202.199.100.146)ping Uint 3中的PC A(202.199.100.147),所發(fā)流量(1518byte/f,700f/s)為8.55Mb/s時(shí),Unit 3工作正常。加大背景流量到9.7Mb/s時(shí)丟包現(xiàn)象開(kāi)始出現(xiàn)。
結(jié)論:堆疊中的Unit 3交換機(jī)可能存在問(wèn)題,但是否由于堆疊口有問(wèn)題引起上述現(xiàn)象,還有待考察。
第二次觀察:(第一天 下午2:40)
網(wǎng)絡(luò)結(jié)構(gòu):同上
在Unit 3中連接兩臺(tái)電腦,IP分別為202.199.100.146和202.199.100.147.除了使用兩臺(tái)電腦互相ping對(duì)方的IP地址外,同時(shí)使用這兩臺(tái)PC ping不在Unit 3中連接的任意客戶機(jī),發(fā)現(xiàn)只有Unit 3中的兩臺(tái)電腦之間的ping包正常,到Unit 3之外的ping包都有丟包。
結(jié)論:Unit 3交換機(jī)端口間傳輸正常,可能堆疊口有問(wèn)題。
第三次觀察:(第一天 下午4:00)
網(wǎng)絡(luò)結(jié)構(gòu):同上
在Unit 3內(nèi)連接PC A (IP為202.199.100.146),Unit 2內(nèi)連接PC B(IP為202.199.100.147),采用發(fā)ping包的方法進(jìn)行測(cè)試,PC A與PC B在互相ping對(duì)方的同時(shí),ping接在堆疊中的其他Unit上的客戶機(jī)的IP地址。
結(jié)果發(fā)現(xiàn)Unit 3中PC A的所有ping操作都有丟包現(xiàn)象發(fā)生,而Unit 2中PC B的ping操作中只有在ping Unit 3中的PC A時(shí)丟包,其他均正常。
結(jié)論:結(jié)合觀察2綜合判斷Unit 3交換機(jī)工作正常,可能堆疊存在問(wèn)題。
第四次觀察:(第一天 下午4:10)
網(wǎng)絡(luò)結(jié)構(gòu):同上
在觀察3的基礎(chǔ)上,把連接到Unit 3的PC A與連接到Unit 2的PC B互換,進(jìn)行上述ping包測(cè)試,PC B ping其他Unit中的客戶機(jī)均有丟包,而PC A只有在ping PC B時(shí)才有丟現(xiàn)象,ping Unit 1和Unit 4和客戶機(jī)均正常。
結(jié)論:可排除丟包現(xiàn)象是由PC引起的因素。
第五次觀察:(第一天 下午4:30)
網(wǎng)絡(luò)結(jié)構(gòu):保持原來(lái)的Unit1、Unit2、Unit4堆疊狀態(tài),把Unit3由原來(lái)的堆疊改為級(jí)聯(lián)。把Unit 3交換機(jī)由原來(lái)的堆疊中斷開(kāi),級(jí)聯(lián)到Unit2上。
然后進(jìn)行和第四次觀察同樣的操作。結(jié)果所有的ping操作均正常,無(wú)丟包現(xiàn)象發(fā)生。
結(jié)論:堆疊存在問(wèn)題,導(dǎo)致ping有丟包現(xiàn)象發(fā)生。
第六次觀察:(第二天 上午9:10左右)
網(wǎng)絡(luò)結(jié)構(gòu):同問(wèn)題觀察 1
在Unit3內(nèi)連接PC A(IP為202.199.100.147)。Unit4內(nèi)連接PC (IP為202.199.100.146),兩機(jī)互相ping的同時(shí),并且ping Unit1、Unit2交換機(jī)上的其他客戶機(jī)。在ping的過(guò)程中,大約在16:25的時(shí)候忽然發(fā)現(xiàn)Unit3中PC B(202.199.100.147)ping不通任何IP地址,而且交換機(jī)燈閃動(dòng)頻率變慢。
用Unit4中的PC B(202.199.100.146)登錄交換機(jī)Web管理頁(yè)面(HTTP:202.199.100.145),登錄失敗;Unit3中的PC A(202.199.100.147)可以登錄到交換機(jī)管理頁(yè)面(HTTP:202.199.100.145),Web管理頁(yè)面中只顯示Unit3,看不到其他Unit,同時(shí)把One Touch接入U(xiǎn)nit 3,One Touch可以ping通交換機(jī)地址(202.199.100.145),也可以ping通PC A,但ping不通PC B。
結(jié)論:說(shuō)明Unit 3堆疊已失效,與堆疊中的其他交換機(jī)無(wú)法通訊。
第七次觀察:(第二天 下午4:00)
網(wǎng)絡(luò)結(jié)構(gòu): 同上
重復(fù)觀察6的操作,再次出現(xiàn)上述現(xiàn)象,這時(shí)重新啟動(dòng)Unit 3 故障依舊。
第八次觀察:(第三天 上午10:30)
3C16980 Unit 1
3C16985B—1 Unit3
3C16985B—2 Unit2
3C169850 Unit4
網(wǎng)絡(luò)結(jié)構(gòu):把Unit 2和Unit3堆疊線纜互換,網(wǎng)絡(luò)工作一切正常,將OneTouch接入U(xiǎn)nit 2中,使用OneTouch模擬流量,同時(shí)Unit 2、Unit3中的電腦互相ping,,當(dāng)利用率為63%(1518byte/f,5000f/s)時(shí),無(wú)丟包現(xiàn)象發(fā)生,利用率為75%(1518byte/f,6000f/s)時(shí)有個(gè)別丟包現(xiàn)象。直到今天,網(wǎng)絡(luò)工作依舊一切正常。
排除心得
綜合以上觀察,可以斷定是交換機(jī)的堆疊有問(wèn)題,因?yàn)榘呀粨Q機(jī)的堆疊調(diào)整后,故障再也沒(méi)有出現(xiàn),初步斷這是交換機(jī)的堆疊線纜沒(méi)插好引想的,把堆疊電纜進(jìn)行更換插好,網(wǎng)絡(luò)工作一切正常。


