新聞資訊
了解故障案例及產品資訊
問題描述
U2000版本:V100R006C02SPC302
OSN 8800 版本:V100R006C03SPC500
如上圖所示,HWO11、HWO21、HWE11、HWE21四個Optix OSN8800設備,其中HWO11和HWO21是同一個網元的主從子架(我們用HWO01來表示這個網元),HWE11和HWE21為獨立的兩個網元。交換機的P3、P7端口屬于Vlan12, P15、P9端口屬于Vlan13。 該站點的HWO01是通過OSC與相鄰站點的網元通訊,當按照組網圖連接好所有的網線后,發現HWO01這個網元托管,HWE11、HWE21監控正常。
處理過程
1.檢查HWO01的DCC配置,光監控DCC信息配置正常。
2.檢查HWE11、HWE21的DCC配置及通訊狀態,以及ECC Link Management狀態,發現HWE11、HWE21是通過ESC監控起來的。 關閉它們的ESC監控后,HWE11、HWE21也脫管。
3.嘗試斷開交換機P15口的網線后,HWO01和HWE11的監控恢復正常,所以懷疑是HWO11與HWE11通過Switch1成環。
4.用一臺PC機接到P15口去PING HWO01的外網IP,不通; PING HWE21的外網IP,正常;
5.用一臺PC機接到P9口去PING HWE11的外網IP,正常;PING HWO01的外網IP,不通(75%丟包,25%超時)
6.用一臺PC機接到P15去PING HWO01的內網IP,發現能PING通;斷開HWO11的ETH1口網線,再PING時不通;證明Switch 1 的P3和P15的Vlan沒劃分開;
7.將我們的PING測試結果反饋給客戶,讓客戶再去檢查交換機配置。客戶修改Switch 1的P15、Switch 2 的P9 Vlan 為Vlan 15.
8.再次用一臺PC機接到P15口,發現PING HWO01的內網IP失敗。
9.按照設計再次連好網線后,發現所有網元通訊正常,可以正常監控
根因
由于這種組網在別的站點也有相同的配置,而且監控正常,所以懷疑是客戶交換機(Switch1、Switch2)配置問題,比如:Vlan沒劃分開等問題。
曾多次讓客戶去檢查交換機配置,反饋配置沒有問題,而且客戶對我們不相信他們,三番五次讓檢查配置很反感,所以我們只好從自己設備角度去定位問題。
建議與總結
1.外網IP、內網IP介紹:
外網IP,是指OSN8800設備上配置的IP,用來網元間通訊的,比如:129.9.21.210等;
內網IP,是指OSN8800設備的主控板IP,比如:192.168.0. 250(主主控IP),192.168.0. 251(備主控IP)。
2.HWO11和HWO21的主從子架通過Switch級聯時,需要使用Y口級聯的方法。具體參見案例“KB1000042904—主從子架通過Switch連接的方案”
3.主從子架通過Switch連接的方案依賴于交換機的正常工作,以及設備與交換機的正常配合,一旦出現問題,定位起來會比較麻煩。如果條件允許,盡量使用網線直連。