新聞資訊
了解故障案例及產品資訊
問題描述
ASON的Trail業務中斷,由于該業務的計劃預置路徑沒有打通,因此該Trail中斷。檢查Trail發現該鏈路中的H站點OSN8800設備上有四塊NS3單板不斷復位,而且該四塊NS3單板及網元上的部分板卡出現頻繁脫管現象。
告警信息
1、脫管單板出現BD_STATUS告警。
2、HARD_BAD
3、TEMP_OVER
處理過程
1、到現場后發現該站點的空調掉電,由于該站點在沙漠地帶,室外溫度達到70度,加上機器不斷持續發熱導致該站點溫度過高。部分設備的前面板及走線槽都出現了融化現象。多塊單板告警等不斷閃爍。
2、空調故障排除后從新上電,發現該站點仍然能在網管上PING通ECC,但是多塊單板包括NS3單板都出現脫管現象。
3、三天后該站點網元脫管。
4、研發和一線技服定位后確認該站點的AUX板卡、NS3板卡等多塊板卡內的部分模塊由于溫度過高而燒毀,通信及各項性能均不能實現,整套設備需要從新發貨。
5、從新發貨后該站點上的ASON業務恢復正常。
根因
1、出現HARD_BAD是因為該站電之前多次掉電,目前網元可以PING通,排除掉電問題。
2、NS3單板以及多塊單板出現BD_STATUS告警,分析原因如下:AUX單板故障;已經配置邏輯單板,物理單板未插入對應槽位;單板插頭與背板插座間松動;單板故障;背板故障。
3、NS3等單板出現TEMP_OVER告警,估計該站點出現空調故障導致單板溫度過高現象。
建議與總結
由于沙漠站點非常偏僻而且溫度非常高,加上都是無人值守的站點,一旦空調出現故障設備都非常容易燒毀,因此建議:
1、考慮到沙特等高溫場境,為板卡提供耐高溫保護。
2、為板卡提供遠程掉電人工控制。