新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問(wèn)題描述
OSN3500設(shè)備N2EFS4單板上報(bào)COMMUN_FAIL告警,涉及多塊單板,故障現(xiàn)象一樣,版本一致。告警參數(shù)為0x03,表示板間以太網(wǎng)通信故障。2小時(shí)左右上報(bào)一次,每次上報(bào)時(shí)間10S左右自動(dòng)恢復(fù)。
主控版本:5.21.17.31
N2EFS4單板版本為5.30
AUX單板版本為3.13
告警信息
頻繁上報(bào)COMMUN_FAIL告警。
處理過(guò)程
1、查看單板復(fù)位記錄,單板有大量復(fù)位記錄。
2、所單板均為狗復(fù)位,從錯(cuò)誤記錄上來(lái)看是申請(qǐng)內(nèi)存失敗。
3、查看發(fā)現(xiàn)EFS4單板對(duì)接的M500EFT單板端口均存在ETH_LOS告警。
4、核實(shí)為EFS4單板對(duì)接的M500EFT單板端口ETH_LOS告警,不斷向EFS單板發(fā)送GFP客戶信號(hào)丟失幀,導(dǎo)致EFS單板GFP管理幀處理任務(wù)申請(qǐng)內(nèi)存后沒(méi)有處理釋放,最終導(dǎo)致單板內(nèi)存耗盡復(fù)位,上報(bào)COMMUN_FAIL告警。
5、排查對(duì)接單板情況,消除其端口ETH_LOS告警可以規(guī)避此問(wèn)題。根本解決該問(wèn)題需要升級(jí)單板軟件到V1R8C01B01c或以后版本。
根因
1、單板復(fù)位引起通信失敗。
2、主控單板和以太網(wǎng)單板間通訊故障
3、告警誤告。
建議與總結(jié)
對(duì)于涉及多塊單板相同現(xiàn)象故障的處理,需要找到共同點(diǎn),不僅是單板本身,和其對(duì)接的單板,環(huán)境因素等都需要考慮。