新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述
OSN7500設(shè)備,10-UXCSA主用,備用9-UXCSA單板上報BUS_ERR、HSC_UNAVAIL告警;
業(yè)務(wù)正常。
單板版本9-UXCSA:8.13;10-UXCSA:8.13;
主機版本:5.21.18.50
9-UXCSA單板告警參數(shù):
1、HSC_UNAVAIL0X040X010X090XFF0XFF
2.BUS_ERR0X040X030X130X020XFF
3.BUS_ERR0X040X040X130X020XFF
處理過程
1、詳細(xì)查詢BUS_ERR告警的參數(shù):para1表示邏輯板位,本例para1數(shù)值為0x04,交叉板監(jiān)測4-SLO1板位發(fā)給自己的業(yè)務(wù)總線存在問題;para2表示該板位中的總線序號本例中數(shù)值為0x03/04;para3的數(shù)值不同的bit為表示不同的告警存在狀態(tài),將返回值換算成16進制數(shù)然后對照查詢;如果para4=0x01則表示交叉板檢測業(yè)務(wù)板過來的總線,如果para4=0x02則表示兩個交叉板握手檢測到的。
2、根據(jù)以上,確認(rèn)為4-SLO1發(fā)給交叉板的信號,兩個交叉板握手信息有問題。
根因
主用交叉板未插好。
解決方案
1、更換9-UXCSA,問題依舊;
2、更換4-SLO1,問題依舊;
3、懷疑主用交叉有問題,但是由于有HSC_UNAVAIL,交叉無法網(wǎng)管倒換,硬切換有風(fēng)險;
4、經(jīng)過咨詢公司研發(fā),對于SLO1單板,僅需要2根總線,也就是說如果真是SLO1或者備用交叉板故障,bus_err告警參數(shù)的第二位應(yīng)該是0X01或者0X02,本次為0X023/OX04,為沒有使用的總線,應(yīng)該是交叉誤報,可以強行切換,不影響業(yè)務(wù);
5、經(jīng)過強行插拔10-UXCSA,進行交叉倒換到9-UXCSA,告警消失,觀察半天消失未重現(xiàn);將單板手動切換回10-UXCSA,問題不重現(xiàn)。
建議與總結(jié)
1、BUS_ERR為NGSDH的常見告警,該問題可能為交叉板收總線、也可能為業(yè)務(wù)槽位發(fā)總線故障,實際定位中無法準(zhǔn)確定位到具體單板,最好帶齊板件,一次解決問題;
2、本次故障比較少見,為主備交叉板握手信號故障,且為主用故障,更換備用交叉無法解決問題。但是由于備用存在告警,無法軟倒換交叉嘗試定位問題,需要硬拔插主用交叉才能觸發(fā)倒換,定位問題。