新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問(wèn)題描述
在進(jìn)行環(huán)形MSP倒換的時(shí)候,某條經(jīng)過(guò)本環(huán)的一條業(yè)務(wù),總是下游特定的兩個(gè)站點(diǎn)#219、#240閃報(bào)2秒AUAIS告警,其他站點(diǎn)不上報(bào)任何告警。由于在此環(huán)的倒換業(yè)務(wù)中斷并沒(méi)有達(dá)到兩秒(經(jīng)過(guò)測(cè)試,倒換業(yè)務(wù)中斷時(shí)間是70ms(該環(huán)距離超長(zhǎng),屬正常現(xiàn)象))。需要向用戶解釋問(wèn)題原因。詳細(xì)的組網(wǎng)圖見(jiàn)附件。
告警信息
AUAIS
處理過(guò)程
1、經(jīng)過(guò)采集數(shù)據(jù)發(fā)現(xiàn)219和240網(wǎng)元的告警濾抖(:alm-get-condetect)沒(méi)有使能,其他網(wǎng)元已經(jīng)全部使能;
2、以下是告警檢測(cè)的機(jī)制:
首先單板(STM64)軟件的告警檢測(cè)任務(wù)周期是1秒,當(dāng)業(yè)務(wù)中斷的時(shí)候,如果單板告警任務(wù)檢測(cè)到了AUAIS,此時(shí)就會(huì)將此告警上報(bào)給平臺(tái),告訴平臺(tái)AUAIS告警開(kāi)始。
同時(shí)單板上層軟件會(huì)在啟動(dòng)的時(shí)候注冊(cè)告警結(jié)束防抖為2,表明主機(jī)平臺(tái)需要在連續(xù)兩次收到告警結(jié)束之后才會(huì)將告警真實(shí)結(jié)束。
由于實(shí)際業(yè)務(wù)只是中斷了70ms,遠(yuǎn)遠(yuǎn)低于1秒,單板上層軟件會(huì)概率性的檢測(cè)到此告警,不會(huì)連續(xù)兩次檢測(cè)到告警,因此單板上報(bào)給主機(jī)平臺(tái)的告警只有一次,馬上就會(huì)結(jié)束。
對(duì)于打開(kāi)了告警濾抖功能的網(wǎng)元(濾抖2秒),主機(jī)平臺(tái)收到了一次告警開(kāi)始,因此會(huì)將此告警濾抖掉,并不能上報(bào)給主機(jī)上層軟件,從而主機(jī)不會(huì)顯示出來(lái)。
對(duì)于沒(méi)有打開(kāi)濾抖功能的網(wǎng)元,一旦單板軟件檢測(cè)到了AUAIS,并且上報(bào)給主機(jī)平臺(tái)后,主機(jī)平臺(tái)會(huì)在等待兩秒之后,如果仍然沒(méi)有告警上報(bào),才會(huì)自行結(jié)束掉告警。因此告警至少會(huì)上報(bào)給主機(jī)上層軟件兩秒,主機(jī)就將此告警顯示出來(lái)。
3、由以上分析可知,未使能告警防抖功能,是問(wèn)題的根本原因。
4、在219網(wǎng)元和240網(wǎng)元上將告警防抖打開(kāi)后,再進(jìn)行復(fù)用段倒換測(cè)試,AUAIS告警不再上報(bào)。
根因
告警防抖功能未使能