新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述
某日客戶反饋工行總行至一網(wǎng)點大客戶業(yè)務(wù)丟包,PING包包長15000字節(jié),丟包率在1%以上。
網(wǎng)絡(luò)拓?fù)?/strong>
工行總行站點使用OSN1500設(shè)備,其他站點為OSN3500,版本為18.50P01
總行OSN1500通過EGS4單板和工行總行邁普路由器對接,EGS4單板配置EVPL匯聚各個網(wǎng)點的業(yè)務(wù),每個網(wǎng)點帶寬為2*VC12,中間鏈路為華為SDH設(shè)備,組網(wǎng)方式為MSP、SNCP,終端鏈路使用R廠家3500E設(shè)備通過STM-1/4光口和華為設(shè)備對接,網(wǎng)點配置R廠家3107等盒式設(shè)備通過FE電口和網(wǎng)點邁普路由器對接,連接關(guān)系如下:
工行總行邁普路由器—(EGS4)工行OSN1500(SL16)—傳輸L—傳輸C—傳輸E(SLQ1)—(STM-1)R廠家3500E(STM-1)—R廠家3107(FE)—網(wǎng)點邁普路由器
其中工行OSN1500設(shè)備位于工行總行,傳輸L位于本地網(wǎng)子網(wǎng),傳輸C和傳輸E位于城域網(wǎng)子網(wǎng),R廠家3500E設(shè)備和傳輸E設(shè)備在同一機(jī)房,R廠家3107位于網(wǎng)點。
無異常告警信息。
處理過程
1、鏈路誤碼導(dǎo)致丟包
2、對接路由器端口故障
3、帶寬不足
4、R廠家網(wǎng)點設(shè)備或匯聚EGS4單板故障
5、以太網(wǎng)封裝對接問題
6、其他網(wǎng)絡(luò)配置
根因
時鐘配置不同步
解決方案
1、通過網(wǎng)管查詢性能,并未發(fā)現(xiàn)鏈路存在誤碼,而且同一路由其他業(yè)務(wù)正常,排除誤碼原因?qū)е聛G包。
2、配置一條路由相同、兩端使用不同以太網(wǎng)端口的業(yè)務(wù)進(jìn)行測試,丟包率依然在1%以上,可以排除工行路由器故障。
3、增加帶寬到4*VC12,經(jīng)過測試丟包率依然在1%以上,故可以排除帶寬不足原因?qū)е碌膩G包。
4、調(diào)整EGS4單板以太網(wǎng)配置,和其他正常運行的業(yè)務(wù)對調(diào)綁定時隙和VCtrunk,經(jīng)過測試依然丟包,使用同型號設(shè)備替換R廠家營業(yè)網(wǎng)點設(shè)備,經(jīng)過測試依然丟包,初步懷疑設(shè)備對接不匹配問題。
5、在和R廠家對接的傳輸E設(shè)備上增加EFS4以太網(wǎng)單板,測試EFS4和R廠家設(shè)備對接情況,分別配置1口到工行總行的EPL業(yè)務(wù),2口到R廠家設(shè)備的EPL業(yè)務(wù),采用分段測試,測試結(jié)果為2段都沒有丟包現(xiàn)象,根據(jù)表面現(xiàn)象初步判斷使用EFS4和R廠家對接沒問題,使用EGS4對接存在丟包,但是由于EGS4單板之前已經(jīng)對調(diào)過VCtrunk,而且其他營業(yè)網(wǎng)點也配置同樣設(shè)備型號,又可以反向證明設(shè)備對接不存在問題。
6、由于之前該客戶網(wǎng)絡(luò)發(fā)生過R廠家設(shè)備時鐘模塊批次問題導(dǎo)致的故障,客戶要求R廠家研發(fā)現(xiàn)場支持問題分析,并且從總部帶來一臺其他型號設(shè)備,使用新設(shè)備替換后經(jīng)過測試沒有丟包,此時可確定R廠家新、老設(shè)備處理對接數(shù)據(jù)時存在差異,為了徹底定位根因,配置一條從傳輸L至傳輸E的VC12級別的業(yè)務(wù),下在傳輸E設(shè)備一空閑光口,R廠家研發(fā)使用儀表對該光口進(jìn)行測試,發(fā)現(xiàn)有指針調(diào)整,測試10分鐘調(diào)整計數(shù)為1000,R廠家研發(fā)答復(fù)該數(shù)值已經(jīng)超出R廠家老設(shè)備處理能力,所以會導(dǎo)致設(shè)備丟包,另外在傳輸E站點查詢該條業(yè)務(wù)15分鐘性能值,指針調(diào)整計數(shù)為1300多塊左右,所以證實存在指針調(diào)整。由于跨子網(wǎng)的業(yè)務(wù)比較少,而且其他業(yè)務(wù)只是從城域網(wǎng)穿通,所以未受影響。
7、查詢?nèi)A為設(shè)備時鐘配置,傳輸L設(shè)備位于本地網(wǎng),時鐘源為BITS外時鐘,傳輸C和傳輸E設(shè)備位于城域網(wǎng),時鐘源為傳輸C內(nèi)部時鐘,兩個子網(wǎng)的時鐘源級別不一致,更改時鐘配置,使傳輸C和傳輸E跟蹤傳輸L,通過儀表測試指針調(diào)整結(jié)束,重新測試原始業(yè)務(wù),測試6個小時未發(fā)現(xiàn)丟包,最終丟包問題解決。
建議與總結(jié)
基于分不同子網(wǎng)管理的傳輸網(wǎng)絡(luò),一般只關(guān)注同一子網(wǎng)的時鐘配置,沒有成環(huán)、互跟、有保護(hù)即可,但是子網(wǎng)間的時鐘級別往往被忽視,此案例就是不同子網(wǎng)時鐘級別不同導(dǎo)致的業(yè)務(wù)丟包,建議每個子網(wǎng)都配置BITS時鐘源,即可實現(xiàn)每個網(wǎng)元跟蹤相同級別時鐘源。