新聞資訊
了解故障案例及產品資訊
問題描述
客戶申報說:兩臺OSN7500與兩臺OSN9500設備組SNCP 10G環,1018-教委8-SL64單板上報MS_REI告警并伴有大量的復用段遠端背景誤碼塊和誤碼秒,對端站點880-東開12-JL64單板沒有任何誤碼,也沒有告警上報。組網為:851-西開---1018-教委---880-東開---1017-長興飯店,其中851-西開、880-東開為OSN9500,1018-教委、1017-長興飯店為OSN7500。組網圖詳見附件。
告警信息
MS_REI
處理過程
1、查詢對端站點880-東開12-JL64單板的15m、24h性能事件,發現沒有再生段、復用段誤碼;
2、查詢880-東開12-JL64單板光功率,均滿足單板收光范圍;
3、對兩端單板分別進行自環,發現兩端單板分別自環后也沒有任何段層誤碼,也沒有MS_REI告警上報;
4、分別對兩端設備光板進行更換,更換后1018-教委8-SL64單板還是上報MS_REI告警,故障依舊;
5、隨后對880-東開設備41、42槽位進行交叉板倒換,倒換后(41-GXCH為主用)1018-教委8-SL64單板MS_REI告警消失,查詢性能也沒有復用段遠端誤碼,因此懷疑42-GXCH單板故障;
6、更換42-GXCH單板后再倒換回42槽位(42-GXCH為主用),1018-教委8-SL64單板又上報MS_REI告警,同時上報大量的復用段遠端誤碼塊和誤碼秒,故障重現;
7、在880-東開站點對1018-教委8-SL64單板進行掛表測試,發現沒有誤碼,儀表不上報MS_REI告警,可以排除對端站點發送和線路問題;
8、在880-東開站點對880-東開12-JL64單板進行掛表測試,發現沒有誤碼,儀表不上報MS_REI告警,同時進行主備交叉板倒換,都沒有段層誤碼,儀表不上報MS_REI告警;
9、與基站進行確認,在傳輸上報MS_REI時,基站業務都正常,同時查詢基站側傳輸設備業務低階誤碼,可以確定的確沒有誤碼,同時更換了所有相應單板,還是上報MS_REI告警,感覺現象十分奇怪,因此懷疑可能是誤報;
10、隨后聯系研發進行咨詢,反饋MS_REI是OSN9500已知缺陷引起的誤報,需要升級OSN9500 J1JL64單板軟件到5.15.04.19P01配套版本(1.65及以上)解決。
根因
根據告警分析,最初懷疑可能對端站點存在再生段、復用段誤碼,但經過一系列定位發現該問題屬于誤報。經過咨詢研發得知:是由于OSN 7500和OSN 9500兩類單板使用的協議不一樣,OSN7500 N1SL64單板利用M0、M1兩個字節指示復用段遠端誤碼塊和誤碼秒,而OSN9500 J1JL64單板只使用M1字節進行指示復用段遠端誤碼塊和誤碼秒,同時會在M0字節回插隨機值。因此在OSN7500 N1SL64單板檢測到M0字節不為零時則會上報MS_REI告警。
建議與總結
在涉及OSN9500設備與其它設備對接時,若出現本端上報MS_REI告警,對端光板沒有任何再生段、復用段誤碼的情況下,可能是由于M0字節問題引起,建議聯系研發確認。