網絡端口採用了1000M速率時候出現網絡通訊丟包+IDC機房託管服務器之間通訊不順暢

時間 2020-05-26

標籤網絡端口採用 1000m 速率時候出現通訊 idc 機房託管服務器之間順暢欄目系統網絡简体版

原文原文鏈接

網絡端口採用了1000M速率時候出現網絡通訊丟包+IDC機房託管服務器之間通訊不順暢

網絡故障：
交換機端口1000M，網卡也是1000M，網卡配置正常。ping時候間隔丟包。
表現爲網絡通訊丟包，而且排除了其餘網絡設置故障。

故障緣由：使用的網線非嚴格質量的超六類網線，網線質量沒法達1000M。

解決方法：將交換機端口設置成100M端口；或者更換爲超六類網線。

故障出現狀況：網絡端口採用了1000M速率時候出現網絡通訊丟包。

目錄：
1.實例場景。網絡端口採用了1000M速率時候出現網絡通訊丟包
2.生產環境。IDC機房託管服務器之間通訊不順暢,禍起ping丟包
3.原理剖析機理分析。爲何會出現網絡丟包的狀況，網絡丟包的緣由是什麼？

【實例場景生產環境】

最近一些局域網的個別互聯網用戶反映上網不穩定時通時斷，結合此次維修工做實際講一下解決此類問題的一點心得。

1、簡單介紹Ping丟包率概念

數據在網絡中是被分紅一個個數據包傳輸的,每一個數據包中都有表示數據的信息和提供數據路由的楨。而數據包在通常介質中傳播是總有一小部分因爲兩個終端的距離過大會丟失,而大部分數據包都會到達目的終端.所謂網絡丟包率是數據包丟失部分與所傳數據包總數的比值.正常傳輸時網絡丟包率應該控制在必定範圍內。

在cmd 中鍵入ping [網址]，顯示最後一行(x% loss)就是對目標地址ping包的丟包率。

2、瞭解一下單位互聯網用戶寬帶接入方式拓撲圖(如圖1所示)

●圖1

3、解決問題的步驟方向

此次咱們要解決的問題是用戶電腦丟包嚴重，有時會影響用戶正常上網，此次解決問題的方法是順藤摸瓜，意思是說由用戶電腦自下而上查找問題。

4、分步驟判斷出問題所在。

(一)介紹形成用戶PC上網丟包緣由：

一、計算機網卡是否損壞;

二、RJ45頭是否損壞,是否線路錯誤;

三、網線是否折傷;

四、設備故障;

下面首先使用用戶的電腦，在cmd 中鍵入ipconfig顯示如圖2所示

●圖2

獲得該網絡的網關(Default Gateway)後，ping 192.168.0.2 -t獲得該網絡丟包率大如圖3所示

●圖3

獲得上述信息後，爲了排除故障點，用本身隨身攜帶的筆記本ping 192.168.0.2獲得的結果依然如圖3所示，首先能夠排除不是用戶電腦網卡的故障。接着查看用戶水晶頭是否製做規範，爲了保險起見，將水晶頭截掉從新作了新的水晶頭，但是故障依舊。這時候就要從用戶這臺機器脫離向上找問題，即順藤摸瓜的方法。

爲了能在24×××換機中迅速定位那根網線是該用戶的，咱們須要用戶幫助我不停地作從網口上拔插網線動做，我就可在交換機指示燈處看到某個燈一滅一亮，注意這裏說的一滅一亮並非頻閃，而是滅了又亮。採用上述辦法就能夠判斷出7口爲用戶所接的交換機的端口，從交換上拔下該網線，用直通線一端接7口，一端筆記本，依然丟包，這樣能夠排除是網線的問題。

須要說明的是此次報修的互聯網用戶是極個別的，說明這個網絡中，絕大部分用戶上網是正常的，找到該交換機空餘的端口，用直通線一端接上，一端接測試用筆記本，目的是經過這種步驟測試出那個端口是無缺的，若是這個不行，能夠試下一個，依次類推，找到一個無缺的端口，儘可能多測試一會，爲了節省時間測試端口時，能夠一直運行着ping包的命令，待出現4圖的情形後，基本可判定該端口可正常使用。

●圖4

爲了保證該端口的能正常使用，能夠多ping一段時間出現圖5所示的情形。能夠將將此次查修用戶的網線插入該測試好的端口中，並加註標籤，以備下次容易查修，而後到用戶電腦上運行cmd命令，ping192.168.02 -t 能夠獲得網絡正常、ping包正常，這次維修工做也已完成。

5、總結

交換機端口出現故障，究其緣由是由於交換機自身的性能發生老化，這就意味着故障交換機的確出現了硬件性能降低的現象，所以會出現上網數據丟包嚴重的現象。總結此次工做，本身的一點心得就是要細心，在平時的工做中多積累，多總結，下次再出現此類問題就能夠迅速的找到問題的所在點，並快速解決問題!

【實例場景生產環境】

IDC機房託管服務器之間通訊不順暢,禍起ping丟包

　　兩個IDC機房託管的服務器之間通訊不順暢，經查，兩個機房間的ping丟包率在8%左右。這樣的丟包率很容易引發TCP鏈接失敗，因爲網絡在線業務異常重要，不得有片刻的停機。因此刻不容緩，立刻處理丟包問題。

●圖5

　　一.ping丟包緣由分析

　　端口速率不匹配是引發丟包的最直接的緣由。而引發端口速率變成半雙工的緣由多是網絡閃斷引發的，好比網關那端的端口速率發生變化，而我方交換機的端口是自適應的，所以在協商後就變成半雙工了。

　　二.判斷ping丟包發生在哪裏

　　從辦公室的計算機分別ping 兩個機房的服務器，而後ping網關，經過對輸出進行比較，發現問題出在辦公地點—望京的機房。再用路由跟蹤的方式測試，得出同樣的結論。

　　三.現場排查服務器之間通訊不順暢

　　檢查網段類服務器之間，服務器與交換機之間，以及交換機之間的網絡通訊狀況時，發ping 包，沒有丟包，但從網內ping 外部任何地址，都有丟包現象出現，路由跟蹤有時不成功。這些狀況能夠代表網段內的通訊是徹底正常的。

　　接下來要作的事情就是測試網關的狀態。網關是一個Cisco 6509交換機，是網通本身管理，我方的交換機經過一條雙絞線與Cisco 6509相連，它是全部服務器的外聯接口。經過技術手段，已經知道上聯交換機的上聯端口是Fa0/41。

　　(1)從網段內的某些服務器ping網關，發現丟包。

　　(2)從外網的某臺計算機ping 這個網關，沒有丟包發生。

　　(3)從外網的某些計算機執行到這個網關的路由跟蹤，狀況正常。

　　(4)用外網遠程的交換機ping小包，狀況正常。

　　(5)從網段內的交換機ping小包，發現丟包。

　　由上面的測試結果能夠得出結論：是我方的交換機與網通交換機(我方服務器的網關)間的鏈路出現故障。前幾天我方爲擴容在機架上施工，有可能碰到了線纜。

　　因而查看交換機指示燈狀態。發現有一個端口指示燈黃綠交替閃爍，仔細一看，是某個交換機的41號端口，並且網線上標明這條線是整個網段的上聯線，即與網關相連的那條線，和先前測試出來的端口是一致的。可能問題就出如今這個交換機上。因而連上Console線，登陸這臺交換機，用命令「# show int f0/41」查看41號端口的輸出，嘿嘿!竟然變成半雙工了。再查看其餘一些端口的雙工狀況，均是自適應，詢問IDC 機房的人，確認網關那個鏈接端口的雙工配置，網關的端口爲全雙工。

　　好，立刻進入配置模式，輸入「# config t, int f0/41,# duplex full」就把交換機的41號端口設置成全雙工了，保存配置。再查看41號端口指示燈的狀態，變爲綠色，這代表故障已經排除。從內外來測試丟包的狀況，一切恢復正常。

【原理剖析機理分析】

爲何會出現網絡丟包的狀況，網絡丟包的緣由是什麼？

網絡丟包是咱們在使用ping對目站進行詢問時，數據包因爲各類緣由在信道中丟失的現象。ping使用了ICMP回送請求與回送回答報文。

    ICMP回送請求報文是主機或路由器向一個特定的目的主機發出的詢問，收到此報文的機器必須給源主機發送ICMP回送回答報文。這種詢問報文用來測試目的站是否可到達以及瞭解其狀態。
    須要指出的是，ping是直接使用網絡層ICMP的一個例子，它沒有經過運輸層的UDP或TCP.
    網絡丟包的緣由主要有物理線路故障、設備故障、病毒***、路由信息錯誤等，下面咱們結合具體狀況進行說明。
路由錯誤
    網絡路徑錯誤也會致使數據包不能到達目的主機，如主機的默認路由配置錯誤，主機發出的訪問其餘網絡的數據包會被網關丟棄。但此類丟包屬於正常狀況下的丟包，是意料之中的，不會對網絡形成影響。
設備故障
    設備故障主要是指設備硬件方面的故障，不包含軟件配置不當形成的丟包。如網卡是壞的，交換機的某個端口出現了物理故障，光纖收發器的電端口與網絡設備接口，或兩端設備接口的雙工模式不匹配。
    筆者近日在工做中發現一交換機端口的光纖模塊故障形成的丟包現象，該交換機在通訊一段時間後死機，即不能通訊，重啓後恢復正常。在通過一段時間觀察後發現，某光纖模塊存在問題，取一塊新的模塊替換，一切正常。
    究其緣由，交換機會對全部接收到的數據包進行CRC錯誤檢測和長度校驗，將檢查出有錯誤的包丟棄，正確的包轉發出去。但這個過程當中有些有錯誤的包在CRC錯誤檢測和長度校驗中都均未檢測出錯誤，這樣的包在轉發過程當中不會被髮送出去，也不會被丟棄，它們將會堆積在動態緩存中，永遠沒法發送出去，等到緩存中堆積滿了，就會形成交換機死機的現象。
    最終結果是，數據包沒法到達目的主機。
●物理線路故障
    網管員發現廣域網線路時通時斷，發生這種狀況時，有多是線路出現故障，也多是用戶方面的緣由。爲了分清是不是線路故障，能夠作以下測試。
    若是廣域網線路是經過路由器實現的，能夠登陸到路由器，經過擴展ping向對端路由器廣域網接口發送大量的數據包進行測試。
    若是線路是經過三層交換機實現，可在線路兩端分別接一臺計算機，並將IP地址分別設爲本端三層路由交換機的廣域網接口地址，使用「ping 對端計算機地址 -t」命令進行測試。
    若是上述測試沒有發生丟包現象，則說明線路運營商提供的線路是好的，引發故障的緣由在於用戶自身，須要進一步查找。
    若是上述測試發生丟包現象，則說明故障是由線路供應商提供的線路引發的，須要與線路供應商聯繫儘快解決問題。
    由物理線路引發的丟包現象還有不少，如光纖鏈接問題，跳線沒有對準設備接口，雙絞線及RJ-45接頭有問題等。另外，通訊線路受到隨機噪聲或者突發噪聲形成的數據報錯誤，射頻信號的干擾和信號的衰減等均可能形成數據包的丟失。咱們能夠藉助網絡測試儀來檢查線路的質量。
●網絡擁塞
    網絡擁塞形成丟包率上升的緣由不少，主要是路由器資源被大量佔用形成的。
    若是發現網速慢，而且丟包率呈現上升的狀況，這時應該show process cpu和show process mem，通常狀況下發現IP input process佔用過多的資源。接下來能夠檢查fast switching在大流量外出端口是否被禁用，若是是，則須要從新使用。
    再看一下Fast switching on the same interface是否被禁用，如一個接口配有多個網段而且這些網段間流量很大時，路由器工做在process-switches方式，這種狀況下要在接口上執行命令「enable ip route-cache same-interface」。
    接下來，用show interfaces和show interfaces switching命令識別大量包進出的端口。一旦確認進入端口後，打開IP accounting on the outgoing interface看其特徵，若是是***，源地址會不斷變化可是目的地址不變，能夠用命令「access list」暫時解決此類問題（最好在接近***源的設備上配置），最終解決辦法是中止***源。
    應用中遇到的形成網絡擁塞的狀況還有不少，如大量的UDP流量，能夠用解決spoof attack的步驟解決此問題。大量的組播流、廣播包穿越路由器，路由器配置了IP NAT而且有不少DNS包穿越路由器等。上述狀況形成網絡擁塞後，通訊雙方採起流量控制，丟棄不能傳輸的包。

●圖6

【全文end】