新聞資訊
了解故障案例及產品資訊
問題描述
客戶日常維護時發現,在用T2000網管查詢OSN3500網元多塊單板的性能事件時,大部分時間都不能正常返回,只是偶爾可以正確查詢到,查詢失敗時上報錯誤碼126979。但單獨查詢其中任意一塊單板的性能時結果都正常,命令行查詢也正常。T2000版本為V2R5C01B01C,設備版本為5.21.15.13。
告警信息
錯誤碼:126979
處理過程
1、分析網管日志確認查詢性能時設備有丟包。
2、網管下發查詢所有單板當前性能,在網管會下發多條操作命令給網元性能主機模塊,性能主機模塊再分發給多個單板性能,等待多塊單板的返回。
3、由于每個單板性能數據量不一樣多,單板性能返回數據給主機性能數據存在時間先后順序的問題,性能主機上接收多塊單板數據異步處理時,對其中當前性能數據為空單板的特殊情況處理不完整,導致當前性能數據為空單板的命令丟失,沒有反饋網管,結果出現網管等待命令超時。
4、后續平臺版本通過如下方式規避處理:在多命令多單板性能數據返回性能主機模塊時,對數據緩存發送和單板查詢空的情況進行處理,解決單板查詢為空的命令結束影響到其它單板多數據命令返回。使性能主機模塊能正確上報各塊單板命令到接口模塊,從而使網管能正確顯示當前性能數據。
根因
由于查詢性能時是概率出現超時現象,很有可能是網管下發命令到網元時,網元側丟包,導致網管誤認為網元沒有返回,上報超時。
建議與總結
該問題在OSP07C03T09和OSP07C02T17及后續版本已經解決,對應產品版本可以參考版本配套表。