新聞資訊
了解故障案例及產品資訊
問題描述
一套OSN7500設備為網關網元,主機版本為5.21.16.13。做為網關網元可以登錄且可以PING通,但發生過5、6次所有下掛的網元無法登錄。當25槽位主控板做為讓主用時,下掛網元全部脫管,進行硬復位,故障仍不解決。切換到24槽位為主用時,下掛網元全部可以登錄。
處理過程
1、 查詢主機版本,剛開始懷疑為序號SC0000385405的預警問題:SSN3GSCC在網關網元上使用時導致網元脫管問題。
2、 根據預警判斷方法,telnet上主主控,未發現有預警中藍色字體的打印信息。
3、 硬復位或插拔主控單板無效,懷疑為硬件故障。
4、 最后更換主控板后故障解決。將故障單板返回公司分析。
根因
1、線路ECC誤碼導致網元脫管。
2、ECC震蕩導致下掛網元脫管。
3、主控板故障導致網元脫管。
4、主機版本缺陷導致網元脫管。
建議與總結
根據公司重現故障分析得出原因:通過返回的參數轉換成HEX可發現如下錯誤規律:錯誤都是每隔31個字節在BIT3(即每隔2Mbit)由0跳變到1。從以上現象確定是OSN7500主控由于CPU處理接收D字節的數據區有故障,導致接收下帶網元的ECC數據BIT有跳變,存在誤碼,從而引起ECC通信不正常,下帶網元就會脫管。