前兩天處理了一個網絡故障,整個過程雖然只有10分鐘,可是我以爲很考驗排錯的思路,這裏寫出來分享一下。網絡
現場的拓撲結構十分簡單,一臺堡壘機,一臺網閘,都直接接在覈心上,IP地址是兩個網段,網關也都在覈心上,相互PING不通。ide
問題就這麼簡單,個人排錯思路以下:測試
1.在覈心分別PING兩臺設備,測試線路及IP,結果:正常設計
2.因爲兩臺設備不是我負責的,沒法直接登陸檢查網關配置是否正確,這裏找了一臺其餘網段的電腦分別PING這兩臺設備,結果:正常接口
3.雖然核心上我是沒有配置過任何ACL來進行限制,我仍是又檢查了一次,確認沒有任何過濾限制產品
4.到了這一步,就必需要登到設備上看一下了,這裏要到了網閘的信息登陸進去,檢查了網絡配置,都正確it
5.網閘是網頁操做,找到測試的頁面,ping堡壘機,不通;ping堡壘機的網關,不通;ping本身的網關,通。//到了這一步,你們如何進行下一步,能夠先不看下面的過程,本身思考一下。class
6.兩種可能性,第一,ping包就沒從設備發出來;第二,ping包發出來了,核心丟掉了。登錄
7.開啓了核心的DEBUG抓包,而後再從網閘上ping,發現沒有提示,核心就沒收到包。包去哪了。配置
8.再檢查網閘的配置,看看是否有限制,過濾一類的配置。看到了管理口配置,地址和堡壘機是一個段,詢問了一下,這個接口沒接線。按正常來講,接口沒接線,地址應該也就不生效,可是爲了排除一切可能性,仍是把這個地址改掉了。而後就通了,說明就是這個沒啓用的接口地址影響了。屬於產品自身的設計問題。
上面這步你們是否是以爲很運氣,正好就看到了,而後也不肯定就刪了測一下,就測通了。從結果倒推出緣由。那麼若是沒看到,下一步應該怎麼作。
9.把筆記本接到核心上,地址先配成網閘一個段的,測一下到堡壘機通不通,還不放心能夠把物理接口對調,最後還能夠把網閘先斷一下,把地址給筆記本再測試,這樣就能夠判斷出問題是在網閘這個設備上。
最後總結,這個問題的處理因爲組網確實太簡單,又是產品自己緣由致使,思路若是不清晰,就會出現無從下手的狀況。理清楚思路,是處理故障的首要。造成本身的方法論,解決問題才能事半功倍。