新聞資訊
了解故障案例及產品資訊
問題描述
OSN3500網關網元異常脫管,業務正常,一會兒自動正常監控,查詢網元側歷史告警返回為空,用戶需要分析原因。主機版本5.21.18.50P01,主控型號為SSN4GSCC。
告警信息
GNE_CONNECT_FAIL、NE_COMMU_BREAK
處理過程
1、由于該網元是網關網元,所以建議用戶ping一下對應IP,用戶反饋還未來得及ping測就已經恢復監控;
2、建議用戶將該網元主用網關修改為其他網關網元,然后將連接設備的網線接入電腦進行長ping,看是否有丟包或中斷情況,長實踐測試發現DCN沒問題;
3、相鄰網元沒有異常告警并且業務正常,排除網元掉電問題;
4、由于查詢網元上歷史告警返回為空,所以懷疑主控板復位,采集errlog復位記錄返回研發分析,發現存在平臺tVos1s任務復位,如下圖紅色部分;
5、咨詢研發得知,對于SSN4GSCC,主機18.55以前版本存在已知平臺問題:8560diab編譯器數組初始化--tVos1s異常復位;
6、觸發主機復位的條件是:無CPU單板比如PIU、AUX等頻繁復位引起的小概率事件。
【解決方法】升級至V1R8C02SPC500(5.21.18.55)版本解決。
根因
1、用戶DCN問題;
2、設備掉電;
3、主控板復位;
4、主控板故障。
建議與總結
建議發布預警,不然一線工程師很難判斷和定位故障,影響故障處理及時率。