新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述
客戶在更換OSN2500設(shè)備主控板時誤操作,再未完成同步的情況下就更換了主板,主備間同步異常,后面又將原來的主板作為備板插入,同步后導(dǎo)致新舊單板的網(wǎng)元ID全部改變,網(wǎng)元脫管,業(yè)務(wù)中斷。原網(wǎng)元ID為1177,異常后網(wǎng)元ID為10007。客戶想使用命令行將網(wǎng)元ID恢復(fù)為1177,此時命令行上報ID沖突錯誤,錯誤碼:39048。
告警信息
NSERROR_CM_NEID_CONFLICT
處理過程
1.將CXL改為單配狀態(tài),對該單板進行復(fù)位,然后修改ID,仍然報錯。
2.更換其他CXL單板做相同操作問題依舊。
3.使用命令行查詢故障網(wǎng)元ECC路由,發(fā)現(xiàn)確實有指向1177網(wǎng)元的路由,跳數(shù)為35,在相鄰網(wǎng)元查看也有該路由跳數(shù)為36。與客戶確認之前是否有ID沖突的網(wǎng)元或者有沒有新加網(wǎng)元的操作,客戶明確表示沒有。
4.在網(wǎng)管上查看相鄰網(wǎng)元的ecc鏈路管理,發(fā)現(xiàn)該1177 ID指向的就是故障網(wǎng)元,但是跳數(shù)異常,同時也有指向10007 ID的路由。
5.與研發(fā)確認,懷疑是子網(wǎng)過大鏈路不穩(wěn),引起路由老化時間過長,導(dǎo)致還能查看的到原1177網(wǎng)元ID的路由。
6.使用cm-set-maxdist命令將故障網(wǎng)元的ECC最大跳數(shù)修改為10,加速路由老化速度,然后再設(shè)置網(wǎng)元ID成功,下載數(shù)據(jù)恢復(fù)業(yè)務(wù)。
根因
1.主控板故障
2.網(wǎng)絡(luò)中有ID沖突的網(wǎng)元
建議與總結(jié)
合理規(guī)劃網(wǎng)絡(luò)子網(wǎng),防止ECC子網(wǎng)過大。