網絡診斷是一門綜合性技術,涉及網絡技術的各個面。爲方便下面的討論,首先簡單回顧一下網絡和路由器的基本概念。
計算機網絡是由計算機集合加通訊設施組成的系統,即利用各類通訊手段,把地理上分散的計算機連在一塊兒,達到相互通訊並且共享軟件、硬件和數據等資源的系統。計算機網絡按其計算機分佈範圍一般被分爲局域網和廣域網。局域網覆蓋地理範圍較小,通常在數米到數十千米之間。廣域網覆蓋地理範圍較大,如校園、城市之間、乃至全球。計算機網絡的發展,致使網絡之間各類形式的鏈接。採用統一協議實現不一樣網絡的互連,使互聯網絡很容易獲得擴展。因特網就是用這種方式完成網絡之間聯結的網絡。因特網採用TCP/IP協議做爲通訊協議,將世界範圍內計算機網絡鏈接在一塊兒,成爲當今世界最大的和最流行的國際性網絡。
爲了完成計算機間的通訊,把每部計算機互連的功能劃分紅定義明確的層次,規定了同層進程通訊的協議及相鄰層之間的接口和服務,將這些層、同層進程通訊的協議及相鄰層之間的接口統稱爲網絡體系結構。國際標準化組織(ISO)提出的開放系統互連參考模型(OSI)是當代計算機網絡技術體系的核心。該模型將網絡功能劃分爲7個層次:物理層、數據鏈路層、網絡層、傳輸層、會話層、表示層和應用層。
TCP/IP即傳輸控制協議和網間互聯協議是一組網絡協議。TCP/IP起源於美國ARPANET網,發展至今已成爲因特網使用的標準通訊協議。使用TCP/IP可以使採用不一樣操做系統的計算機以有序的方式交換數據。
路由器是一種網絡設備,是用於網絡鏈接、執行路由選擇任務的專用計算機。路由器工做於網絡層,對信包轉發,並具備過濾功能。路由器可以將使用不一樣技術的兩個網絡互連起來,可以在多種類型的網絡之間(局域網或廣域網)創建網絡鏈接。它將處在七層模型中的網絡層的信息,根據最快、最直接的路由原理從一個網絡的網絡層傳輸到另外一個網絡的網絡層,以達到最佳路由選擇。同時在內部使用高檔微處理器,用高速的內部總線鏈接適合各類網絡協議的接口卡。並具備多種網管功能,能監視與路由器相鏈接的一些網絡設備和它們的配置運行狀況。
CISCO路由器是目前網絡建設中使用最多的一種路由器,有多種檔次、多種系列,目前經常使用的當屬2500系列,本文以2500系列爲例討論。2500系列路由器是固定接口的多協議路由器,支持CISCO IOS所有功能。根據特定的協議環境分爲如下四種類型:固定配置的路由器(2501)、帶HUB口的路由器(2507)、摸塊化的路由器(2514)和訪問服務器(2511)。它們結構簡單、操做方便、易於配置和管理,是一種用於小規模局域網和廣域網網絡層中繼的路由設備。
CISCO IOS是CISCO所特有的互連網操做系統,全部的CISCO產品都運行IOS,IOS將它們無縫鏈接在一塊兒協同工做。給用戶提供一個可支持任意硬件界面、任意鏈路層、網絡層協議的可擴展的開放型網絡。IOS支持衆多的協議,包括各類網絡通訊協議和路由協議等。CISCO IOS已成爲工業界網際網互聯的事實標準。CISCO IOS提供幾種不一樣的操做模式,每一種模式提供一組相關的命令集、不一樣的操做權限和操做功能。基於安全目的,CISCO用戶界面中有兩級訪問權限:用戶級和特權級。第一級訪問容許查看路由狀態,叫作用戶EXEC模式,又稱爲查看模式;第二級訪問容許查看路由器配置、修改配置和運行調試命令,叫作特權 EXEC模式,又稱爲配置模式。在特權級中,按不一樣的配置內容,可進入不一樣的配置模式,如全球配置模式、接口配置模式、線配置模式等。
網絡故障診斷概述
網絡故障診斷應該實現三方面的目的:肯定網絡的故障點,恢復網絡的正常運行;發現網絡規劃和配置中欠佳之處,改善和優化網絡的性能;觀察網絡的運行情況,及時預測網絡通訊質量。
網絡故障診斷以網絡原理、網絡配置和網絡運行的知識爲基礎。從故障現象出發,以網絡診斷工具爲手段獲取診斷信息,肯定網絡故障點,查找問題的根源,排除故障,恢復網絡正常運行。
網絡故障一般有如下幾種可能:物理層中物理設備相互鏈接失敗或者硬件及線路自己的問題;數據鏈路層的網絡設備的接口配置問題;網絡層網絡協議配置或操做錯誤;傳輸層的設備性能或通訊擁塞問題;上三層CISCO IOS或網絡應用程序錯誤。診斷網絡故障的過程應該沿着OSI七層模型從物理層開始向上進行。首先檢查物理層,而後檢查數據鏈路層,以此類推,設法肯定通訊失敗的故障點,直到系統通訊正常爲止。
網絡診斷可使用包括局域網或廣域網分析儀在內的多種工具:
路由器診斷命令;網絡管理工具和其它故障診斷工具。CISCO提供的工具足以勝任排除絕大多數網絡故障。查看路由表,是解決網絡故障開始的好地方。
ICMP的ping、trace命令和Cisco的show命令、debug命令是獲取故障診斷有用信息的網絡工具。咱們一般使用一個或多個命令收集相應的信息,在給定狀況下,肯定使用什麼命令獲取所須要的信息。譬如,經過IP協議來測定設備是否可達到的經常使用方法是使用ping命令。ping從源點向目標發出ICMP信息包,若是成功的話,返回的ping信息包就證明從源點到目標之間全部物理層、數據鏈路層和網絡層的功能都運行正常。
如何在互聯網絡運行後瞭解它的信息,瞭解網絡是否正常運行,監視和了解網絡在正常條件下運行細節,瞭解出現故障的狀況。監視那些內容呢?利用show interface命令能夠很是容易地得到待檢查的每一個接口的信息。另外show buffer命令提供按期顯示緩衝區大小、用途及使用情況等。Show proc命令和 show proc mem命令可用於跟蹤處理器和內存的使用狀況,能夠按期收集這些數據,在故障出現時,用於診斷參考。
網絡故障以某種症狀表現出來,故障症狀包括通常性的(象用戶不能接入某個服務器)和較特殊的(如路由器不在路由表中)。對每個症狀使用特定的故障診斷工具和方法都能查找出一個或多個故障緣由。通常故障排除模式以下:
第一步,當分析網絡故障時,首先要清楚故障現象。應該詳細說明故障的症侯和潛在的緣由。爲此,要肯定故障的具體現象,而後肯定形成這種故障現象的緣由的類型。例如,主機不響應客戶請求服務。可能的故障緣由是主機配置問題、接口卡故障或路由器配置命令丟失等。
第二步,收集須要的用於幫助隔離可能故障緣由的信息。向用戶、網絡管理員、管理者和其餘關鍵人物提一些和故障有關的問題。普遍的從網絡管理系統、協議分析跟蹤、路由器診斷命令的輸出報告或軟件說明書中收集有用的信息。
第三步,根據收集到的狀況考慮可能的故障緣由。能夠根據有關狀況排除某些故障緣由。例如,根據某些資料能夠排除硬件故障,把注意力放軟件緣由上。對於任何機會都應該設法減小可能的故障緣由,以致於儘快的策劃出有效的故障診斷計劃。
第四步,根據最後的可能的故障緣由,創建一個診斷計劃。開始僅用一個最可能的故障緣由進行診斷活動,這樣能夠容易恢復到故障的原始狀態。若是一次同時考慮一個以上的故障緣由,試圖返回故障原始狀態就困難的多了。
第五步,執行診斷計劃,認真作好每一步測試和觀察,直到故障症狀消失。
第六步,每改變一個參數都要確認其結果。分析結果肯定問題是否解決,若是沒有解決,繼續下去,直到解決。
網絡故障分層診斷技術
1. 物理層及其診斷
物理層是OSI分層結構體系中最基礎的一層,它創建在通訊媒體的基礎上,實現系統和通訊媒體的物理接口,爲數據鏈路實體之間進行透明傳輸,爲創建、保持和拆除計算機和網絡之間的物理鏈接提供服務。
物理層的故障主要表如今設備的物理鏈接方式是否恰當;鏈接電纜是否正確;MODEM、CSU/DSU等設備的配置及操做是否正確。
肯定路由器端口物理鏈接是否無缺的最佳方法是使用show interface命令,檢查每一個端口的狀態,解釋屏幕輸出信息,查看端口狀態、協議創建狀態和EIA狀態。
2. 數據鏈路層及其診斷
數據鏈路層的主要任務是使網絡層無須瞭解物理層的特徵而得到可靠的傳輸。數據鏈路層爲經過鏈路層的數據進行打包和解包、差錯檢測和必定的校訂能力,並協調共享介質。在數據鏈路層交換數據以前,協議關注的是造成幀和同步設備。
查找和排除數據鏈路層的故障,須要查看路由器的配置,檢查鏈接端口的共享同一數據鏈路層的封裝狀況。每對接口要和與其通訊的其餘設備有相同的封裝。經過查看路由器的配置檢查其封裝,或者使用show命令查看相應接口的封裝狀況。
3. 網絡層及其診斷
網絡層提供創建、保持和釋放網絡層鏈接的手段,包括路由選擇、流量控制、傳輸確認、中斷、差錯及故障恢復等。
排除網絡層故障的基本方法是:沿着從源到目標的路徑,查看路由器路由表,同時檢查路由器接口的IP地址。若是路由沒有在路由表中出現,應該經過檢查來肯定是否已經輸入適當的靜態路由、默認路由或者動態路由。而後手工配置一些丟失的路由,或者排除一些動態路由選擇過程的故障,包括RIP或者IGRP路由協議出現的故障。例如,對於IGRP路由選擇信息只在同一自治系統號(AS)的系統之間交換數據,查看路由器配置的自治系統號的匹配狀況。
路由器接口故障排除
1. 串口故障排除
串口出現連通性問題時,爲了排除串口故障,通常是從show interface serial命令開始,分析它的屏幕輸出報告內容,找出問題之所在。串口報告的開始提供了該接口狀態和線路協議狀態。接口和線路協議的可能組合有如下幾種:1)串口運行、線路協議運行,這是徹底的工做條件。該串口和線路協議已經初始化,並正在交換協議的存活信息。2)串口運行、線路協議關閉,這個顯示說明路由器與提供載波檢測信號的設備鏈接,代表載波信號出如今本地和遠程的調制解調器之間,但沒有正確交換鏈接兩端的協議存活信息。可能的故障發生在路由器配置問題、調制解調器操做問題、租用線路干擾或遠程路由器故障,數字式調制解調器的時鐘問題,經過鏈路鏈接的兩個串口不在同一子網上,都會出現這個報告。 3)串口和線路協議都關閉,多是電信部門的線路故障、電纜故障或者是調制解調器故障。4)串口管理性關閉和線路協議關閉,這種狀況是在接口配置中輸入了 shutdown命令。經過輸入no shutdown命令,打開管理性關閉。
接口和線路協議都運行的情況下,雖然串口鏈路的基本通訊創建起來了,但仍然可能因爲信息包丟失和信息包錯誤時會出現許多潛在的故障問題。正常通訊時接口輸入或輸出信息包不該該丟失,或者丟失的量很是小,並且不會增長。若是信息包丟失有規律性增長,代表經過該接口傳輸的通訊量超過接口所能處理的通訊量。解決的辦法是增長線路容量。查找其餘緣由發生的信息包丟失,查看show interface serial命令的輸出報告中的輸入輸出保持隊列的狀態。當發現保持隊列中信息包數量達到了信息的最大容許值,能夠增長保持隊列設置的大小。
2.以太接口故障排除
以太接口的典型故障問題是:帶寬的過度利用;碰撞衝突次數頻繁;使用不兼容的幀類型。使用show interface ethernet命令能夠查看該接口的吞吐量、碰橦衝突、信息包丟失、和幀類型的有關內容等。
經過查看接口的吞吐量能夠檢測網絡的利用。若是網絡廣播信息包的百分比很高,網絡性能開始降低。光纖網轉換到以太網段的信息包可能會淹沒以太口。互聯網發生這種狀況能夠採用優化接口的措施,即在以太接口使用no ip route-cache命令,禁用快速轉換,而且調整緩衝區和保持隊列。
兩個接口試圖同時傳輸信息包到以太電纜上時,將發生碰橦.以太網要求衝突次數不多,不一樣的網絡要求是不一樣的,通常狀況發現衝突每秒有三、5次就應該查找衝突的緣由了。碰橦衝突產生擁塞,碰橦衝突的緣由一般是因爲敷設的電纜過長、過度利用、或者「聾」節點。以太網絡在物理設計和敷設電纜系統管理方面應有所考慮,超規範敷設電纜可能引發更多的衝突發生。
若是接口和線路協議報告運行狀態,而且節點的物理鏈接都無缺,但是不能通訊。引發問題的緣由也多是兩個節點使用了不兼容的幀類型。解決問題的辦法是從新配置使用相同幀類型。若是要求使用不一樣幀類型的同一網絡的兩個設備互相通訊,能夠在路由器接口使用子接口,併爲每一個子接口指定不一樣的封裝類型。
3. 異步通訊口故障排除
互連網絡的運行中,異步通訊口的任務是爲用戶提供可靠服務,但又是故障多發部位。主要的問題是,在經過異步鏈路傳輸基於LAN通訊量時,將丟失的信息包的量降止最少。
異步通訊口故障通常的外部因素是:撥號鏈路性能低劣;電話網交換機的鏈接質量問題;調制解調器的設置。檢查鏈路兩端使用的調制解調器:鏈接到遠程PC機端口調制解調器的問題不太多,由於每次生成新的撥號時一般都初始化調制解調器,利用大多數通訊程序都能在發出撥號命令以前發送適當的設置字符串;鏈接路由器端口的問題較多,這個調制解調器一般等待來自遠程調制解調器的鏈接,鏈接以前,並不接收設置字符串。若是調制解調器丟失了它的設置,應採用一種方法來初始化遠程調制解調器。簡單的辦法是使用可經過前面板配置的調制解調器,另外一種方法是將調制解調器接到路由器的異步接口,創建反向telnet,發送設置命令配置調制解調器。
show interface async 命令、show line命令是診斷異步通訊口故障使用最多的工具。show interface async 命令輸出報告中,接口狀態報告關閉的惟一的狀況是接口沒有設置封裝類型。線路協議狀態顯示與串口線路協議顯示相同。show line命令顯示接口接收和傳輸速度設置以及EIA狀態顯示。show line命令能夠認爲是接口命令(show interface async)的擴展。show line命令輸出的EIA信號及網絡狀態:
noCTS noDSR DTR RTS:調制解調器未與異步接口鏈接。
CTS noDSR DTR RTS:調制解調器與異步接口鏈接正常,但未鏈接遠程調制解調器。
CTS DSR DTR RTS:遠程調制解調器撥號進入並創建鏈接。
肯定異步通訊口故障通常可用下列步驟:檢查電纜線路質量;檢查調制解調器的參數設置;檢查調制解調器的鏈接速度;檢查rxspeed 和txspeed是否與調制解調器的配置匹配;經過show interface async 命令和 show line命令查看端口的通訊情況;從show line命令的報告檢查EIA狀態顯示;檢查接口封裝;檢查信息包丟失及緩衝區丟失狀況。
結語
網絡發生故障是不可避免的。網絡建成運行後,網絡故障診斷是網絡管理的重要技術工做。搞好網絡的運行管理和故障診斷工做,提升故障診斷水平須要注意如下幾方面的問題:認真學習有關網絡技術理論;清楚網絡的結構設計,包括網絡拓樸、設備鏈接、系統參數設置及軟件使用;瞭解網絡正常運行情況、注意收集網絡正常運行時的各類狀態和報告輸出參數;熟悉經常使用的診斷工具,準確的描述故障現象。