新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述
OSN3500設(shè)備因機(jī)房停電掉電,OSN3500恢復(fù)供電后主控,交叉,業(yè)務(wù)板上報一系列告警,導(dǎo)致業(yè)務(wù)不通。
主機(jī)版本:5.21.20.55,單配主控,雙配交叉,故障時刻9槽位交叉板是主用。
告警信息
HARD_BAD:
7槽位EGS2參數(shù):0X010X000X060XFF0XFF
13槽位EFS0參數(shù):0X010X000X060XFF0XFF
18槽位GSCC參數(shù):0X020XFF0XFF0XFF0XFF
9槽位SXCSA參數(shù):0X020X000X040XFF0XFF
CHIP_FAIL:
9槽位SXCSA參數(shù):0X000X000X000X010X00
2槽位PQ1
OOL
9槽位SXCSA參數(shù):030001ffff
10槽位SXCSA參數(shù):010001ffff
Temp_over
9槽位SXCSA參數(shù):01000101ff
HSC_UNAVAIL
9槽位SXCSA參數(shù):030109ffff
Bus_err
10槽位SXCSA參數(shù):0d010301ff
Syn_bad
10槽位SXCSA參數(shù):0801ffffff
處理過程
1、現(xiàn)場測試電壓-54V,屬于正常范圍。
2、再次同步核對告警,AUX沒有任何告警,結(jié)合現(xiàn)場單板指示燈狀態(tài)正常,如果AUX異常單板是不能開工的。
3、網(wǎng)元上報告警比較多,使用命令行查詢單板物理板和邏輯板狀態(tài)正常,現(xiàn)場反饋板卡指示燈也是正常,考慮到業(yè)務(wù)是全阻,故主控和交叉板的故障可能性最大。通過分析單配主控的HARD_BAD告警,參數(shù)定位是2槽位PQ1異常,主控問題可能性不大。繼續(xù)分析,發(fā)現(xiàn)9槽位(主用)交叉板告警較多。嘗試網(wǎng)管倒換復(fù)位交叉板失敗。
4、網(wǎng)管反饋10槽位交叉板主動變?yōu)橹饔脿顟B(tài),告警條數(shù)和參數(shù)無變化,網(wǎng)管硬復(fù)位9槽位后,告警條數(shù)和參數(shù)持續(xù)不變。
5、網(wǎng)管查詢交叉板溫度,命令行為(:cfg-get-bdtemp:9),溫度是70度,已經(jīng)超過溫度上門限,故上報tempover正常,現(xiàn)場核實(shí)機(jī)房空調(diào)停電后未工作,機(jī)房溫度較高。故懷疑9槽位單板工作異常,和溫度有關(guān)。
5、建議現(xiàn)場拔出9槽位觀察,同時協(xié)調(diào)好備件。現(xiàn)場反饋拔出9槽位等待幾分鐘后,所有告警逐漸消失,核實(shí)業(yè)務(wù)也恢復(fù)了。
6、為了準(zhǔn)備定位是9槽位交叉板異常就是溫度導(dǎo)致(之前單板持續(xù)上報tempover),將單板重新插入9槽位后,觀察業(yè)務(wù)持續(xù)正常,查詢交叉溫度較之前低10度。
根因
定位是溫度過高引起單板重新上電后工作異常,上報一系列告警。
建議與總結(jié)
定位清洗風(fēng)扇防塵網(wǎng),控制好機(jī)房溫度和濕度。
OptiXOSN設(shè)備正常運(yùn)行對溫度和濕度的要求為:(溫度、濕度的測量點(diǎn),是指在機(jī)架前后沒有保護(hù)板時測量,距地板以上1.5m和距機(jī)架前方0.4m處測量的數(shù)值。)
長期運(yùn)行溫度:0℃~45℃
短期運(yùn)行溫度(短期運(yùn)行是指連續(xù)工作不超過96小時和每年累計不超過15天。):-5℃~55℃
長期運(yùn)行濕度5%~85%
短期運(yùn)行濕度5%~95%
同時為提升產(chǎn)品應(yīng)用可靠性,機(jī)房應(yīng)配備機(jī)房專用精密空調(diào),將溫度和濕度控制在下面范圍:
空調(diào)控制溫度:15-30℃。
空調(diào)控制濕度:40%-75%。
注意:空調(diào)禁止安裝在設(shè)備上方,空調(diào)出風(fēng)口應(yīng)避免直接吹向設(shè)備,空調(diào)安裝時應(yīng)盡量遠(yuǎn)離窗戶,以避免將透窗的濕氣通過空調(diào)吹向設(shè)