新聞資訊
了解故障案例及產品資訊
問題描述
工程師在網管發現一臺新建OSN6800子架有多塊單板上報COMMUN_FAIL告警,且告警上報時間相同,該子架為主子架,沒有配置從子架;
查看該網元歷史告警,發現在出現COMMUN_FAIL告警之前,該網元曾上報過SUBRACK_LOOP告警。
告警信息
COMMUN_FAIL;SUBRACK_LOOP
處理過程
安排站點工程師帶AUX備件去現場,拔插AUX板,單板復位后告警消失,觀察20分鐘,該告警沒有再上報。
根因
1、查看COMMUN_FAIL告警參數,參數為0x010x000x03,表示板間ETH通信失效
2、網元曾上報過SUBRACK_LOOP,該告警一分鐘后消除,該告警表示子架間網口環回,可以引起廣播風暴,從而導致個別通信端口吊死
3、AUX單板故障也可引起COMMUN_FAIL
建議與總結
此案例是由于設備主從模式下,子架間內網口連接成環,引起以太網廣播風暴,沖掉了AUX一些單板的通信端口,導致這些單板通信失效。
由此可見,如COMMUN_FAIL告警同時伴隨SUBRACK_LOOP,建議仔細檢查子架間的網線連接,如SUBRACK_LOOP告警已消失,但COMMUN_FAIL仍存在,則建議硬復位AUX單板。
另外,COMMUN_FAIL告警參數如下,供參考:
參數為0x010x000x01時,表示RS485的1號通道失效;
參數為0x010x000x02時,表示RS485的2號通道失效;
參數為0x010x000x03時,表示板間ETH通信失效;
參數為0x010x000x04時,表示子架間緊急ETH通信失效。