新聞資訊
了解故障案例及產品資訊
問題描述
OSN3500 EMS4單板LPT功能被觸發但前段無相關告警(ETH_LOS),當前端路由器發生短時業務中斷,LPT功能被使能,業務中斷。由于前端的EMS4打開了告警防抖功能,前端的EMS4單板并沒有上報相關告警(ETH_LOS)。
告警信息
一端上報告警LPT_RFI,另一端不上報ETH_LOS
處理過程
關閉相關網元的的告警防抖功能。
根因
LPT_RFI和ETH_LOS實現如下:
LPT_RFI:250ms,100優先級任務輪詢。
ETH_LOS:1000ms,140優先級任務輪詢。
告警防抖:LPT_RFI告警2秒防抖后上報主機,ETH_LOS告警依靠主機的2秒防抖。
主機防抖:2次
防抖過程:LPT_RFI檢測到端口link_down持續2秒后,隨即持續上報主機,間隔250ms。主機收到這個告警,根據是否需要防抖(默認需要)決定是否立即上報網管。由于有2次防抖,注意這里是兩次不是兩秒。所以,主機在收到這個告警500ms后就上報給網管。而對于ETH_LOS任務,主機在收到ETH_LOS告警后,如果要防抖2次,單板1秒報一次,那么2秒后才會上報網管。
所以如果告警時間很短,那么網管上就只能顯示出LPT_RFI,但沒有ETH_LOS告警。
但根據上面的分析,如果使用:alm-set-condetect:disable命令去掉主機的防抖功能,那么就沒有上面的問題了。
建議與總結
如發生LPT功能使能但對端單板無上報相關告警,建議關閉網元的告警防抖功能。