新聞資訊
了解故障案例及產品資訊
問題描述
在進行OSN3500掉電單站測試的時候存在N2PQ1的業務不能正常恢復,導致業務中斷,N2PQ1在管網上顯示灰色(未開工狀態),解決的方法是再軟復位一下PQ1單板。
版本配置:主控版本是:5.21.13.47p01,N2PQ1版本是4.13
處理過程
1、臨時解決辦法是再次復位一下PQ1單板,但這不能解決根本問題。
2、用R7版本的N2PQ1版本,升級到 NGSDH V100R007C02B017(5.21.17.31)+N2PQ1(5.30)版本,這個版本解決了這個問題。
根因
1、R3版本主機代碼的消息隊列和多板ID單板申請開工存在配合問題。
2、N2PQ1支持雙ID,N2和N1,在主機R6版本以下只能使用N1 ID。N2PQ1單板支持“單板兼容替換功能”,其物理板ID為SSN2PQ1,邏輯板ID可以配置為N1/N2兩種;
3、R6以下版本,配置有N2PQ1單板的設備在掉電時可能會存在問題:設備掉電時,N2PQ1將先于GSCC起來,這是N2PQ1無法從GSCC上獲取配置,將自動使用N2PQ1的ID,當GSCC啟動時,這是PQ1的邏輯單板是N1的,但是物理單板是N2的,這樣的話業務就會斷了。
4、咨詢研發后,給出的解釋是:多板ID在老主機上的一個匹配過程,以如下面所講的N2PQ1為例,設備掉電時,的確N2PQ1會將先于GSCC起來,首先N2PQ1會以N2PQ1開工,但這時主機還沒有完全起來,這個時候的確是不會匹配成功,但我們單板軟件會發現以N2PQ1開工長時間(12×3s)不能開工,就會更換為N1PQ1開工,如果以N1PQ1開工還是長時間(12×3s)不能開工,就更換為N2PQ1進行開工,依次這樣循環更換板類型(N1PQ1和N2PQ1)進行開工,對R6版本,對這個循環更換板類型的板類型的次數做了限制,N2PQ1單板就為10次,如果匹配次數到達了這個極限值,就不會輪巡匹配了,由于主機起來的時間比較長,如果這個時間超過了輪巡10次的時間,那么這時有可能是以N2PQ1申請開工,也有可能N1PQ1申請開工,現網這個現象是以N2PQ1開工的,所以物理板檢測的是亂碼。對R7及后續版本就沒有這個限制,一直都是輪巡匹配,直到匹配成功。
建議與總結
1、對于緊急恢復措施:
當現網使用R3及以前版本的網元在掉電重啟時遇到該問題,請對單板主動進行軟復位,就可以解決。
對出現該問題的現場具體判斷如下:
1)、確定單板為多板ID單板;
2)、網管上看不到物理板類型或在Navigator上顯示的物理板類型為亂碼(數字代號);
3)、查詢告警存在WRG_BD_TYPE告警;
2、了解OSN的多板ID技術可以幫助此類問題的理解和解決