記一次典型的故障排錯

    前兩天處理了一個網絡故障,整個過程雖然只有10分鐘,可是我以爲很考驗排錯的思路,這裏寫出來分享一下。網絡

    現場的拓撲結構十分簡單,一臺堡壘機,一臺網閘,都直接接在覈心上,IP地址是兩個網段,網關也都在覈心上,相互PING不通。ide

      問題就這麼簡單,個人排錯思路以下:測試

      1.在覈心分別PING兩臺設備,測試線路及IP,結果:正常設計

      2.因爲兩臺設備不是我負責的,沒法直接登陸檢查網關配置是否正確,這裏找了一臺其餘網段的電腦分別PING這兩臺設備,結果:正常接口

      3.雖然核心上我是沒有配置過任何ACL來進行限制,我仍是又檢查了一次,確認沒有任何過濾限制產品

      4.到了這一步,就必需要登到設備上看一下了,這裏要到了網閘的信息登陸進去,檢查了網絡配置,都正確it

      5.網閘是網頁操做,找到測試的頁面,ping堡壘機,不通;ping堡壘機的網關,不通;ping本身的網關,通。//到了這一步,你們如何進行下一步,能夠先不看下面的過程,本身思考一下。class

      6.兩種可能性,第一,ping包就沒從設備發出來;第二,ping包發出來了,核心丟掉了。登錄

      7.開啓了核心的DEBUG抓包,而後再從網閘上ping,發現沒有提示,核心就沒收到包。包去哪了。配置

      8.再檢查網閘的配置,看看是否有限制,過濾一類的配置。看到了管理口配置,地址和堡壘機是一個段,詢問了一下,這個接口沒接線。按正常來講,接口沒接線,地址應該也就不生效,可是爲了排除一切可能性,仍是把這個地址改掉了。而後就通了,說明就是這個沒啓用的接口地址影響了。屬於產品自身的設計問題。

      上面這步你們是否是以爲很運氣,正好就看到了,而後也不肯定就刪了測一下,就測通了。從結果倒推出緣由。那麼若是沒看到,下一步應該怎麼作。

      9.把筆記本接到核心上,地址先配成網閘一個段的,測一下到堡壘機通不通,還不放心能夠把物理接口對調,最後還能夠把網閘先斷一下,把地址給筆記本再測試,這樣就能夠判斷出問題是在網閘這個設備上。

      最後總結,這個問題的處理因爲組網確實太簡單,又是產品自己緣由致使,思路若是不清晰,就會出現無從下手的狀況。理清楚思路,是處理故障的首要。造成本身的方法論,解決問題才能事半功倍。

相關文章
相關標籤/搜索