新聞資訊
了解故障案例及產品資訊
問題描述(故障現象)
在PTN沒有做任何操作情況下,移動在做全網LTE基站升級后反饋大量上報SCTP路徑斷告警,該告警經無線解釋主要產生機理如下:
每個LTE基站同核心網側共4個地址建立偶聯鏈接,當某個核心網管理地址同基站通信失敗后會上報SCTP路徑斷告警,當告警產生時,SCTP建鏈會同另外三個地址建鏈,不會影響偶聯及業務,但是會觸發無線上報該告警。
組網環境
全網受到影響基站不固定,較為分散,據了解以前也曾出現過,均在基站進行操作后發生,然后每天告警逐漸減少,經過幾天震蕩后則基本消失。
原因分析
1.問題定位初期,檢查現網是否存在相關節點的異常告警及性能,發現站點不存在對應的異常告警及性能。
2.懷疑網絡中是否存在廣播風暴問題,經過排查,現網不存在該類問題,主要檢查了網絡中關鍵路徑的廣播報文,組播報文的統計情況,不存在異常,同時也未發現有帶寬利用率超限的情況。
3.承載側對無線提取出問題站點進行重點檢查分析,詳細檢查節點在網絡中分布情況,確認是否存在公用路徑、公用節點可能引起基站閃報SCTP路徑斷告警,仔細檢查后并未發現明顯的公用路徑及節點;
4.通過以往經驗,均為發現明顯異常,著重檢查上游核心層設備,首先檢查橋接點的相關配置,發現有部分橋接組的虛子接口配置了vlan range的封裝方式,再繼續排查,發現出問題的無線基站基本下掛在該類橋接組下,懷疑問題可能跟該配置有關。
5.選取部分該種配置,修改為其他未出現問題的配置方式,然后無線驗證發現基站SCTP路徑斷告警消失;
6.繼續進行驗證,采取抓包方式進行分析:
選取未修改的橋接組業務在基站側設備進行鏡像抓包,在65L3落地點進行鏡像抓包,即在上圖中的1、2處進行鏡像抓包,發現有少量SCTP建鏈報文丟失。
將抓包有丟失的橋接組進行修改,修改后再進行抓包分析,發現丟包現象消失,隨后將全部vlan range配置刪除,SCTP路徑斷告警基本消失。
7.分析為何該種配置會引起SCTP建鏈報文丟失:
實際在上述組網中,橋接點采取VSI的業務模型方式,二層方面采取EVPLAN業務模型,而對于ZXCTN 6500R1版本不支持vlanrange方式的組網配置,導致配置后可能出現SCTP建鏈報文丟失的問題,修改為正常配置后,無線建鏈正常,告警消失。
附配置截圖如下。
L3虛接口修改后的配置方式:
L3虛子接口修改前配置方式:
解決方案
對于R1版本的ZXCTN 6500設備作為L2L3橋接點,新建的L2/L3虛子接口不應該配置vlanrange的VLAN封裝類型,若已配置則需要修改,修改辦法如下:
1、 刪除三層虛子接口下ARP綁定永久關系(注意對于每個網段需要修改S1和OMC兩個子接口,此操作會中斷業務,需要晚上申請工單操作);
2、 通過命令行,修改L2/L3虛子接口封裝類型為dot1q;
3、 主橋接點進行網管對三層虛子接口下的ARP“轉永久”;
4、 備橋接點通過命令行進行ARP綁定永久操作,并寫盤保存后上載。