交換機(jī)發(fā)生網(wǎng)絡(luò)通信故障問(wèn)題時(shí)該怎么辦?
瀏覽次數(shù):發(fā)布時(shí)間:2020-03-16
交換機(jī)故障一般可以分為硬件故障和軟件故障兩大類(lèi),交換機(jī)雖然不常發(fā)生故障,但是一旦發(fā)生故障后都不太好檢測(cè)與排除。那么,當(dāng)交換機(jī)發(fā)生網(wǎng)絡(luò)通信故障了該怎么辦呢?今天就由
飛暢科技的小編來(lái)給大家說(shuō)說(shuō)交換機(jī)網(wǎng)絡(luò)通信故障怎么辦,感興趣的朋友就一起來(lái)詳細(xì)了解下吧。
交換機(jī)網(wǎng)絡(luò)通信故障怎么辦?
一、物理層線路連接
物理層線路連接是網(wǎng)絡(luò)正常使用的提前,不得不指出,很多時(shí)候所謂的網(wǎng)絡(luò)故障是因?yàn)槲锢韺泳€路接連所導(dǎo)致,比如:連接相應(yīng)桌面計(jì)算機(jī)的雙絞線連接了錯(cuò)誤的交換機(jī)接口、RJ45連接頭松脫、沒(méi)有連接物理線纜等。在這里需要特別提出的是飛暢科技的交換機(jī)連接交換機(jī)使用交叉雙絞線、交換機(jī)與路由器或者計(jì)算機(jī)相連使用直通雙絞線。
如果您需要交換機(jī)在某個(gè)接口上進(jìn)行自適應(yīng)介質(zhì)接口,就必須在相關(guān)的接口模式下啟動(dòng)auto-MDIX指令,auto-MDIX的全稱(chēng)叫做automaticmedium-dependentinterfacecrossover自動(dòng)介質(zhì)接口交叉,當(dāng)啟動(dòng)這個(gè)功能后,無(wú)論接口連接的是哪種類(lèi)型的線纜,交換機(jī)都能自動(dòng)調(diào)節(jié)該接口使其保持正常的工作。啟動(dòng)auto-MDIX有一個(gè)要求:該接口必須能自動(dòng)協(xié)商速率與雙工模式。
二、雙工模式
雙式模式不匹配可能會(huì)產(chǎn)生相關(guān)的故障。以本書(shū)出版的時(shí)間為界線,現(xiàn)今網(wǎng)絡(luò)市場(chǎng)上幾乎所有的設(shè)備都支持全雙工模式,當(dāng)然除了傳統(tǒng)的集線器(HUB)設(shè)備外,應(yīng)該讓所有的網(wǎng)絡(luò)設(shè)備處于全雙式的模式下。默認(rèn)情況下,飛暢科技建議將交換機(jī)的接口配置成自動(dòng)協(xié)商速度與雙工模式。
這樣做的理由是:如果發(fā)生一個(gè)半雙工的設(shè)備去連接
飛暢科技交換機(jī),那么,飛暢科技的交換機(jī)將把自己的全雙工降級(jí)成半雙工模式以適應(yīng)該設(shè)備的運(yùn)行,如果管理員強(qiáng)制要求交換機(jī)接口工作在全雙工模式下,將產(chǎn)生接口錯(cuò)誤。排除的依據(jù)是使用showinterfacesfastEthernet0/1counterserrors查看接口上的錯(cuò)誤。
三、接口出錯(cuò)
交換機(jī)的接口出錯(cuò)通常會(huì)導(dǎo)致大量的數(shù)據(jù)幀,比如:當(dāng)用戶發(fā)現(xiàn)基于TCP的應(yīng)用變得非常緩慢時(shí),從表面看上去TCP的應(yīng)用變慢是乎與交換機(jī)接口故障無(wú)關(guān),但是進(jìn)一步思考,TCP變慢的更多原因是由于TCP慢啟動(dòng)所致,在TCP慢啟動(dòng)的狀態(tài)下TCP的滑動(dòng)窗口尺寸將變小,而這種現(xiàn)象往往是交換機(jī)丟包所致,在這種狀況下,基于UDP的應(yīng)用就更可怕,因?yàn)閁DP根本不會(huì)重傳,所以網(wǎng)絡(luò)質(zhì)量將嚴(yán)重下降。
所以在排除這種故障時(shí),我們需要知道,交換機(jī)為什么丟包,這往往與交換機(jī)的接口錯(cuò)誤有關(guān),必須查看交換機(jī)接口的錯(cuò)誤統(tǒng)計(jì)消息,關(guān)于交換機(jī)接口的錯(cuò)誤統(tǒng)計(jì)消息,可以通過(guò)showinterfacex/ycounterserrors來(lái)得到,現(xiàn)在來(lái)理解每個(gè)錯(cuò)誤統(tǒng)計(jì)器的意義:
nAlign-Err(對(duì)齊錯(cuò)誤):如果數(shù)據(jù)幀不是以偶數(shù)個(gè)八位組結(jié)束就會(huì)出現(xiàn)對(duì)齊錯(cuò)誤,指示是物理層差錯(cuò),一般是由于布線、交換機(jī)接口故障所引發(fā)。
nFCS-Err(幀校驗(yàn)錯(cuò)誤):幀校驗(yàn)錯(cuò)誤,通常也發(fā)生在物理層,并伴隨Align-Err現(xiàn)象。
nXmit-Err(發(fā)送錯(cuò)誤):指示交換機(jī)的接口發(fā)送緩存溢出,這通常是入站和出站速率不匹配所造成的。
nRcv-Err(接收錯(cuò)誤):指示交換機(jī)的接口接收緩存溢出,這通常是交換機(jī)的背板發(fā)生擁塞,導(dǎo)致接收緩存被堆滿。在很多時(shí)候接收錯(cuò)誤也暗示了雙工模式不匹配。
nUnderSize(超短幀):指示校驗(yàn)和有效,但是幀尺寸小于64字節(jié),這表示連接到該接口的主機(jī)正在發(fā)送無(wú)效的數(shù)據(jù)幀尺寸。
nSingle-Col(單一沖突):指示在該接口成功發(fā)送數(shù)據(jù)幀之前,產(chǎn)生了一次沖突時(shí)會(huì)發(fā)生單一沖突錯(cuò)誤,產(chǎn)生這種錯(cuò)誤的原因是鏈路的使用率過(guò)高或者雙工不匹配。
nMulti-Col(多次沖突):指示在該接口成功發(fā)送數(shù)據(jù)幀之前,產(chǎn)生了多次沖突時(shí)會(huì)發(fā)生多次沖突錯(cuò)誤,產(chǎn)生這種錯(cuò)誤的原因是鏈路的使用率過(guò)高或者雙工不匹配。
nLate-Col(后期沖突):指示轉(zhuǎn)發(fā)數(shù)據(jù)幀以后,才檢測(cè)到的沖突,產(chǎn)生這種錯(cuò)誤的原因是物理介質(zhì)(比如:線纜)過(guò)長(zhǎng)、或者雙工不匹配。
nExcess-Col(過(guò)載沖突):當(dāng)數(shù)據(jù)幀連續(xù)遇到16次沖突后會(huì)被丟棄,此時(shí)就會(huì)出現(xiàn)過(guò)載沖突錯(cuò)誤,產(chǎn)生這種錯(cuò)誤的主要原因是鏈路的使用率過(guò)高、雙工不匹配、網(wǎng)絡(luò)中的設(shè)備特別是半雙工設(shè)備太多。
nCarri-Sen(載波偵聽(tīng)):指示該接口工作在半雙工狀態(tài),根據(jù)CSMA/CD的工作原理,在半雙工狀態(tài)下發(fā)送數(shù)據(jù)時(shí),需要進(jìn)行沖突檢測(cè)這將增加carri-sen計(jì)數(shù)器,在全雙工的模式下是不使用CSMA/CD。
nRunts(殘幀):幀的尺寸小于64個(gè)字節(jié),而且CRC錯(cuò)誤,出現(xiàn)殘幀的錯(cuò)誤一般是由物理層故障或者雙工模式不匹配所導(dǎo)致的。
nGiants(超長(zhǎng)幀):幀的尺寸大于1518個(gè)字節(jié),通常出現(xiàn)超長(zhǎng)幀錯(cuò)誤是主機(jī)NIC故障所導(dǎo)致。
四、交換機(jī)CPU的使用率過(guò)高
通常交換機(jī)的架構(gòu)由兩個(gè)層面組成:一個(gè)控制層面、一個(gè)轉(zhuǎn)發(fā)層面??刂茖用尕?fù)責(zé)運(yùn)行交換機(jī)的操作系統(tǒng),STP、路由協(xié)議、維護(hù)路由表、執(zhí)行ACL等,控制層面包括交換機(jī)的CPU和內(nèi)存。
轉(zhuǎn)發(fā)層面包括交換機(jī)的轉(zhuǎn)發(fā)邏輯和背板,交換機(jī)的轉(zhuǎn)發(fā)邏輯是交換機(jī)用于做出轉(zhuǎn)發(fā)決定的硬件,該硬件負(fù)責(zé)重寫(xiě)數(shù)據(jù)幀頭;
而交換機(jī)的背板負(fù)責(zé)物理連接到交換機(jī)的端口,它依賴(lài)于交換機(jī)的體系統(tǒng)架構(gòu),數(shù)據(jù)幀從交換機(jī)的入站接口進(jìn)入,然后轉(zhuǎn)發(fā)給交換機(jī)的背板,最后通過(guò)出站接口轉(zhuǎn)發(fā)數(shù)據(jù)幀。注意在這個(gè)過(guò)程中控制平面并不直接參與數(shù)據(jù)幀的轉(zhuǎn)發(fā)操作。所以在交換機(jī)正常工作的情況下,即便是流量轉(zhuǎn)發(fā)的高峰期,交換機(jī)的CPU占用率也應(yīng)該很低,因?yàn)樗恢苯訁⒓恿髁哭D(zhuǎn)發(fā)。
雖然控制層面不直接參與流量轉(zhuǎn)發(fā),但是由于轉(zhuǎn)發(fā)層面中的轉(zhuǎn)發(fā)邏輯卻來(lái)自于控制層面,因?yàn)閿?shù)據(jù)幀思轉(zhuǎn)發(fā)與控制層面還是存在一定的間接關(guān)系的,這樣的話,如果控制層面出現(xiàn)持續(xù)性的高負(fù)載,比如CPU占用率過(guò)高,這將影響交換機(jī)轉(zhuǎn)發(fā)數(shù)據(jù)的速率。所以從交換機(jī)的架構(gòu)來(lái)講,控制層面不會(huì)影響交換機(jī)的性能,但是在故障排除時(shí)還必須考慮控制層面的因素。
交換機(jī)的轉(zhuǎn)發(fā)邏輯以一個(gè)叫做TCAM的專(zhuān)用內(nèi)存體現(xiàn),TCAM與交換機(jī)的CEF功能相結(jié)合,數(shù)據(jù)轉(zhuǎn)發(fā)的速度將非???,但是一旦轉(zhuǎn)發(fā)邏輯故障,比如:TCAM內(nèi)存溢出,轉(zhuǎn)發(fā)邏輯將無(wú)法轉(zhuǎn)發(fā)流量,此時(shí)將由交換機(jī)的CPU來(lái)完成轉(zhuǎn)發(fā)流量,這將增加交換機(jī)CPU的開(kāi)銷(xiāo),轉(zhuǎn)發(fā)能力也會(huì)被降低?;蛘邠Q一句話來(lái)講,如果交換機(jī)的CPU占用率過(guò)高,這表示交換機(jī)已經(jīng)沒(méi)有使用轉(zhuǎn)發(fā)邏輯轉(zhuǎn)發(fā)數(shù)據(jù)幀,需要及時(shí)排查故障。