新聞資訊
了解故障案例及產品資訊
問題描述(故障現象)
A-B-C-D四臺中興ZXMP S385設備組成一個2.5G速率的二纖雙向復用段保護環,B站點下掛的的接入環設備ET1上報不可用秒告警,并伴隨有背景塊誤碼和誤塊秒。
組網環境
A-B-C-D四臺ZXMP S385設備組成一個2.5G速率的二纖雙向復用段保護環,其中A和B分別下掛有幾個接入環
原因分析
1、線路問題;
2、光板問題;
3、交叉板問題;
4、時鐘板問題;
5、外部環境溫度過高。
解決方案
從受影響業務的經過路徑和受影響范圍分析,故障業務路由均經過A、B和C三個站點,因此,故障只可能出現在A、B和C三個站點。
下面以1月13日15:00至15:30時間段做故障分析:
(1)查看故障發生時A性能和告警,發現與B相連接的10#OL16光板上檢測到大量的VC4誤碼,但是沒有再生段或復用段誤碼,說明光路正常;
(2)同時交叉板上檢測到大量的TU12-LOP告警和VC12誤碼率越限告警;
(3)查看故障發生時C性能和告警,發現與B相連接的7#OL16光板檢測到大量的VC4誤碼,但是沒有再生段或復用段誤碼,說明光路也正常,同時C交叉板上檢測到TU12-LOP告警和VC12誤碼率越限告警;
(4)根據傳輸系統對誤碼的檢測機制,傳輸設備只對接收到的信號進行檢測,對自身發送的信號不檢測,所以某個站點出現誤碼,要么是接收過來的信號帶有誤碼,要么是設備自身產生的誤碼;
(5)從以上告警及性能分析,A檢測到的誤碼如果是在自身產生,誤碼并不會對B下掛的網元造成影響,因為B下掛網元的業務路徑沒有經過A,故不可能是A導致;
(6)分析C的情況:與C相連的光方向中,有上連核心網絡的2.5G光路、下掛S200的155M光路、以及某片區匯聚環組網的2.5G光路,除了收B的方向7#OL16光板檢測到誤碼外,其他方向都沒有檢測到誤碼。同時檢查C下掛的ZXMP S200網元,也沒有發現誤碼,所以C的問題導致故障的可能性比較小;
(7)分析B的情況:查看B的性能,B的各個光方向都沒有檢測到誤碼,同時在B下掛的網元,都檢測到了誤碼,說明B接收到的信號都正常,但其他網元接收來自B的信號帶了誤碼。至此,問題的根源定位在B可能性比較大;
(8)通常情況下,造成傳輸設備產生VC4誤碼、TU12-LOP告警和VC12誤碼率越限有以下可能原因:
①交叉板故障
②時鐘板故障
中興S385設備交叉板由空分模塊、時分模塊、時鐘單元模塊共同構成。通過檢查全網的時鐘源配置,發現C從B方向引接線路時鐘,如果B時鐘單元出現問題,肯定也會影響到C以及C下掛網元的業務,故可以排除B和C時鐘單元故障;
(9)由于B和C中興S385設備的業務均工作在9#槽位交叉時鐘板上,且配置的是分散型業務,最終將問題定位在B和C的9#槽位的時分板上;
(10)由于B可能性比較大,決定先對B進行操作。1-15日零點將B的時鐘總線、開銷、業務總線從9#交叉板倒換至8#交叉板,截止1-17日凌晨1點,沒再出現誤碼。
注意事項
本次誤碼故障的最終定位為B站點9#交叉板故障,將壞板寄回實驗室后測量時分板電源發現,1.2v電源模塊M1輸出電壓異常,為0.94v,這個電源模塊給時分芯片供電,電壓偏低會導致芯片工作異常,業務中斷。而且現網的交叉板版本不支持低電壓倒換機制,最新的交叉板版本(V3.20R1P04)支持低電壓倒換機制,當M1輸出電壓降低到0.97V左右可以倒換,并上報“單板運行不正常告警”。