新聞資訊
了解故障案例及產品資訊
問題描述
逆時針方向170-178-179-180-181-182網元組成MSP環。其中170為OSN7500,其余設備為OSN3500設備。在178站點通過ECC鏈路管理顯示178到達170網元是通過179網元進行轉發。170網元11-T2SL64和178網元8-N2SL64對接。
處理過程
1)170,178站點ECC設置問題(沒有使能,使用字節不一致,ECC)
2)ECC通道數量不夠
3)主控問題
4)線路單板問題
5)其他問題如ECC協議棧校驗開關不一致等
根因
178站點SL64線路單板故障
解決方案
1)使用網管和命令行CM-GET-BDINFO檢查170網元ECC分配情況正常
顯示如下: FIBER-PORT-STATE
BID PORT PORT-STATE PORT-RATE LINK-CHAN LOGIC-CHAN-STATE
6 1 port-enable D1-D3 0 ok
6 2 port-enable D1-D3 1 ok
7 1 port-enable D1-D3 2 ok
8 1 port-enable D1-D3 3 ok
11 1 port-enable D1-D3 4 ok
12 1 port-enable D1-D3 5 ok
13 1 port-enable D1-D3 6 ok
使用cm-get-chaninfo:4命令查詢對應單板的ECC通道狀態,顯示收發字節都有且在增加(詳細見附件),但DNEID顯示的是0X00FFFFFF,SNEID顯示的是0x000900b2(178)
2)在178網元使用cm-get-bdinfo命令查詢顯示為收失敗
FIBER-PORT-STATE
BID PORT PORT-STATE PORT-RATE LINK-CHAN LOGIC-CHAN-STATE
8 1 port-enable D1-D3 0 rx_f
11 1 port-enable D1-D3 1 ok
使用cm-get-chaninfo:0命令查詢顯示此通道只有發字節,沒有收字節。但DNEID顯示的是0000000000,SNEID顯示的是0000000000。
3)在170,178使用命令cm-get-chanerror查詢,此兩單板ECC通道均無誤碼。
4)硬復位170站點GSCC,178站點GSCC單板,現象依舊,硬復位170站點SL64單板,178站點SL64單板,現象依舊。
5)更換178站點SL64單板,故障解決。
建議與總結
ECC故障原因比較多,有誤碼導致,ECC校驗狀態不一致,端口分配,使能狀態,通道字節(D1-D12,D1-D3,D4-D12),主機,線路單板等。定位故障時cm-get-eccroute,cm-get-bdinfo,cm-get-chaninfo,cm-get-chanerror這幾條命令是非常有用的,通過對返回參數的分析基本可以定位到故障站點和故障單板。