用戶接觸到的,只是最上面的一層,根本沒有感受到下面的層,要理解互聯網,必須從最下層開始,自下而上,理解每一層的功能。瀏覽器
如何分層有不一樣的模型,有的模型分七層,有的分四層。我以爲,把互聯網分紅五層,比較容易解釋。服務器
如上圖所示,越下面的層,越靠近硬件,越上面的層,越靠近用戶markdown
每一層都是爲了完成一種功能,爲了實現這種功能,就須要你們都遵照共同的規則。網絡
你們都遵照的規則就叫作‘協議’架構
互聯網的每一層都定義了不少協議,這些協議的總稱,就叫作‘互聯網協議’。他們是互聯網的核心,下面介紹每一層的功能,主要就是介紹每一層的主要協議。app
電腦要組網,第一件事要幹什麼?固然是先把電腦鏈接起來,能夠用光纜,電纜,雙絞線,無線電波等方式。socket
這就叫作‘ 實體層’,他就是把電腦鏈接起來的物理手段。它主要規定了網絡的一些電器特性,做用就是負責傳送0和1的電信號oop
單純的0和1沒有任何意義,必須規定解讀方式:多少個電信號算一組?每一個信號位有何意義?ui
這就是‘鏈接層’的功能,它在‘實體層’的上方,確認了0和1的分組方式 。google
早期的時候,每家公司都有本身的電信號分組方式。逐漸的。一種叫作‘以太網’的協議佔據了主導地位。
以太網規定,一組電信號構成一個數據包,叫作‘幀’。每一幀分紅兩個部分:標頭(Head)和數據(Data)
‘標頭’包含數據包的一些說明項,好比,發送者(MAC地址)、接受者、數據類型等等;‘數據’則是數據包的具體內容。
‘標頭’的長度固定爲18字節,‘數據’的長度,最短爲46字節,最長爲1500字節,所以,整個‘幀’最短爲64字節,最長爲1518字節,若是數據很長,就必須分割成多個幀進行發送。
上面提到,以太網數據報的‘標頭’,包含了發送者和接受者的信息,那麼,發送者和接受者是如何標識的呢?
以太網規定,連入網絡的全部設備都必須具備‘網卡’接口,數據包必須是從一塊網卡,傳送到另外一塊網卡,網卡的地址就是數據包的發送地址和接收地址,這叫作MAC地址。
每塊網卡出場的時候,都有一個全世界獨一無二的MAC地址,長度是48個二進制位,一般用12個十六進制數表示。
前6個十六進制數是廠商標號,後6個是該廠商的網卡流水號,有了MAC地址,就能夠定位網卡和數據包的路徑了
首先,一塊網卡怎麼會知道另外一塊網卡的MAC地址
回答:是有一種ARP協議(做用:將已知的IP地址轉換爲MAC地址,可是ARP協議只能在局域網內使用,操做系統首先判斷目標ip是否爲局域網內,若是不是局域網內會將消息幀發送到網關,操做系統初始化時會有默認的網關地址,網關收到消息後會路由表進行消息轉發),能夠解決這個問題,這個留到後面介紹,這裏只須要知道,以太網數據包必須知道接收方的MAC地址,而後才能發送
其次,就算有了MAC地址,系統怎樣才能把數據包準確送到接收方?
回答: 以太網採用了一種很原始的方式,它不是把數據包準確的發送到接收放,而是向本網絡內全部計算機發送,讓每一臺計算機本身判斷,是否爲接收方
上圖中,1號計算機向2號計算機發送一個數據包,同一個子網絡的三、四、5號計算機都會收到這個包,他們讀取這個包的‘標頭’,找到接收方的MAC地址,而後與自身的MAC地址相比較,若是相同,就接受這個包,作進一步處理,不然就丟棄這個包,這種發送方式就叫作‘廣播’
有了數據包的定義、網卡的MAC地址、廣播的發送方式,‘連接層’就能夠在多臺計算機之間傳送數據了
4.1網絡層的由來
以太網協議,依靠MAC地址發送數據,理論上,單單依靠MAC地址,上海的網卡就能夠找到洛杉磯的網卡了,技術上是能夠實現的。
可是,這樣作有一個重大的缺點,以太網採用廣播方式發送數據包,全部成員人手一‘包’,不只效率低,並且侷限在發送者所在的子網絡,也就是說,若是兩臺計算機再也不同一個子網絡,也就是說,若是兩臺計算機再也不同一個子網絡,廣播是傳不過去的,這種設計是合理的,不然互聯網上每一臺計算機都會收到全部的包,那會引發災難。
互聯網是無數子網絡共同組成的一個巨型網絡,很難想象上海和洛杉磯的電腦會在同一個子網絡,這幾乎是不可能的
所以,必須找到一種方法,可以區分哪些MAC地址屬於同一個子網絡,哪些不是,若是是同一個子網絡,就採用廣播的方式發送,不然就採用‘路由’方式發送(‘路由’的意思就是指,如何向不一樣的子網絡分發數據包,這是一個很大的主題,本文不涉及)遺憾的是,MAC地址自己沒法作到這一點,它只與廠商有關,與所處網絡無關。
這就致使了」網絡層」的誕生。它的做用是引進一套新的地址,使得咱們可以區分不一樣的計算機是否屬於同一個子網絡。這套地址就叫作」網絡地址」,簡稱」網址」。
因而,」網絡層」出現之後,每臺計算機有了兩種地址,一種是MAC地址,另外一種是網絡地址。兩種地址之間沒有任何聯繫,MAC地址是綁定在網卡上的,網絡地址則是管理員分配的,它們只是隨機組合在一塊兒。
網絡地址幫助咱們肯定計算機所在的子網絡,MAC地址則將數據包送到該子網絡中的目標網卡。所以,從邏輯上能夠推斷,一定是先處理網絡地址,而後再處理MAC地址。
規定網絡地址的協議,叫作IP協議。它所定義的地址,就被稱爲IP地址。
目前,普遍採用的是IP協議第四版(IPv4在2019年11月25日已經用盡,目前採用的是IPv6),簡稱IPv4。這個版本規定,網絡地址由32個二進制位組成。
習慣上,咱們用分紅四段的十進制數表示IP地址,從0.0.0.0一直到255.255.255.255。
互聯網上的每一臺計算機,都會分配到一個IP地址。這個地址分紅兩個部分,前一部分表明網絡,後一部分表明主機。好比,IP地址172.16.254.1,這是一個32位的地址,假定它的網絡部分是前24位(172.16.254),那麼主機部分就是後8位(最後的那個1)。處於同一個子網絡的電腦,它們IP地址的網絡部分一定是相同的,也就是說172.16.254.2應該與172.16.254.1處在同一個子網絡。
可是,問題在於單單從IP地址,咱們沒法判斷網絡部分。仍是以172.16.254.1爲例,它的網絡部分,究竟是前24位,仍是前16位,甚至前28位,從IP地址上是看不出來的。
那麼,怎樣才能從IP地址,判斷兩臺計算機是否屬於同一個子網絡呢?這就要用到另外一個參數」子網掩碼」(subnet mask)。
所謂」子網掩碼」,就是表示子網絡特徵的一個參數。它在形式上等同於IP地址,也是一個32位二進制數字,它的網絡部分所有爲1,主機部分所有爲0。好比,IP地址172.16.254.1,若是已知網絡部分是前24位,主機部分是後8位,那麼子網絡掩碼就是11111111.11111111.11111111.00000000,寫成十進制就是255.255.255.0。
知道」子網掩碼」,咱們就能判斷,任意兩個IP地址是否處在同一個子網絡。方法是將兩個IP地址與子網掩碼分別進行AND運算(兩個數位都爲1,運算結果爲1,不然爲0),而後比較結果是否相同,若是是的話,就代表它們在同一個子網絡中,不然就不是。
好比,已知IP地址172.16.254.1和172.16.254.233的子網掩碼都是255.255.255.0,請問它們是否在同一個子網絡?二者與子網掩碼分別進行AND運算,結果都是172.16.254.0,所以它們在同一個子網絡。
總結一下,IP協議的做用主要有兩個,一個是爲每一臺計算機分配IP地址,另外一個是肯定哪些地址在同一個子網絡。
根據IP協議發送的數據,就叫作IP數據包。不難想象,其中一定包括IP地址信息。
可是前面說過,以太網數據包只包含MAC地址,並無IP地址的欄位。那麼是否須要修改數據定義,再添加一個欄位呢?
回答是不須要,咱們能夠把IP數據包直接放進以太網數據包的」數據」部分,所以徹底不用修改以太網的規格。這就是互聯網分層結構的好處:上層的變更徹底不涉及下層的結構。
具體來講,IP數據包也分爲」標頭」和」數據」兩個部分。
「標頭」部分主要包括版本、長度、IP地址等信息,」數據」部分則是IP數據包的具體內容。它放進以太網數據包後,以太網數據包就變成了下面這樣。
IP數據包的」標頭」部分的長度爲20到60字節,整個數據包的總長度最大爲65,535字節。所以,理論上,一個IP數據包的」數據」部分,最長爲65,515字節。前面說過,以太網數據包的」數據」部分,最長只有1500字節。所以,若是IP數據包超過了1500字節,它就須要分割成幾個以太網數據包,分開發送了。
關於」網絡層」,還有最後一點須要說明。
由於IP數據包是放在以太網數據包裏發送的,因此咱們必須同時知道兩個地址,一個是對方的MAC地址,另外一個是對方的IP地址。一般狀況下,對方的IP地址是已知的(後文會解釋),可是咱們不知道它的MAC地址。
因此,咱們須要一種機制,可以從IP地址獲得MAC地址。
這裏又能夠分紅兩種狀況:
第一種狀況:若是兩臺主機不在同一個子網絡,那麼事實上沒有辦法獲得對方的MAC地址,只能把數據包傳送到兩個子網絡鏈接處的」網關」(gateway),讓網關去處理。
第二種狀況:若是兩臺主機在同一個子網絡,那麼咱們能夠用ARP協議,獲得對方的MAC地址。ARP協議也是發出一個數據包(包含在以太網數據包中),其中包含它所要查詢主機的IP地址,在對方的MAC地址這一欄,填的是FF:FF:FF:FF:FF:FF,表示這是一個」廣播」地址。它所在子網絡的每一臺主機,都會收到這個數據包,從中取出IP地址,與自身的IP地址進行比較。若是二者相同,就作出回覆,向對方報告本身的MAC地址,不然就丟棄這個包。
因此,這裏有必要再提醒一下,ARP協議只能用在同一個子網絡環境下,有了ARP協議以後,
咱們就能夠獲得同一個子網絡內的主機MAC地址,能夠把數據包發送到目標電腦上了
複製代碼
有了MAC地址和IP地址,咱們已經能夠在互聯網上任意兩臺主機上創建通訊。
接下來的問題是,同一臺主機上有許多程序都須要用到網絡,好比,你一邊瀏覽網頁,一邊與朋友在線聊天。當一個數據包從互聯網上發來的時候,你怎麼知道,它是表示網頁的內容,仍是表示在線聊天的內容?
也就是說,咱們還須要一個參數,表示這個數據包到底供哪一個程序(進程)使用。這個參數就叫作」端口」(port),它實際上是每個使用網卡的程序的編號。每一個數據包都發到主機的特定端口,因此不一樣的程序就能取到本身所須要的數據。
「端口」是0到65535之間的一個整數,正好16個二進制位。0到1023的端口被系統佔用,用戶只能選用大於1023的端口。無論是瀏覽網頁仍是在線聊天,應用程序會隨機選用一個端口,而後與服務器的相應端口聯繫。
「傳輸層」的功能,就是創建」端口到端口」的通訊。相比之下,」網絡層」的功能是創建」主機到主機」的通訊。只要肯定主機和端口,咱們就能實現程序之間的交流。所以,Unix系統就把主機+端口,叫作」套接字」(socket)。有了它,就能夠進行網絡應用程序開發了。
如今,咱們必須在數據包中加入端口信息,這就須要新的協議。最簡單的實現叫作UDP協議,它的格式幾乎就是在數據前面,加上端口號。
UDP數據包,也是由」標頭」和」數據」兩部分組成。
「標頭」部分主要定義了發出端口和接收端口,」數據」部分就是具體的內容。而後,把整個UDP數據包放入IP數據包的」數據」部分,而前面說過,IP數據包又是放在以太網數據包之中的,因此整個以太網數據包如今變成了下面這樣:
UDP數據包很是簡單,」標頭」部分一共只有8個字節,總長度不超過65,535字節,正好放進一個IP數據包。
UDP協議的優勢是比較簡單,容易實現,可是缺點是可靠性較差,一旦數據包發出,沒法知道對方是否收到。
爲了解決這個問題,提升網絡可靠性,TCP協議就誕生了。這個協議很是複雜,但能夠近似認爲,它就是有確認機制的UDP協議,每發出一個數據包都要求確認。若是有一個數據包遺失,就收不到確認,發出方就知道有必要重發這個數據包了。
所以,TCP協議可以確保數據不會遺失。它的缺點是過程複雜、實現困難、消耗較多的資源。
TCP數據包和UDP數據包同樣,都是內嵌在IP數據包的」數據」部分。TCP數據包沒有長度限制,理論上能夠無限長,可是爲了保證網絡的效率,一般TCP數據包的長度不會超過IP數據包的長度,以確保單個TCP數據包沒必要再分割。
應用程序收到」傳輸層」的數據,接下來就要進行解讀。因爲互聯網是開放架構,數據來源五花八門,必須事先規定好格式,不然根本沒法解讀。
「應用層」的做用,就是規定應用程序的數據格式。
舉例來講,TCP協議能夠爲各類各樣的程序傳遞數據,好比Email、WWW、FTP等等。那麼,必須有不一樣協議規定電子郵件、網頁、FTP數據的格式,這些應用程序協議就構成了」應用層」。
這是最高的一層,直接面對用戶。它的數據就放在TCP數據包的」數據」部分。所以,如今的以太網的數據包就變成下面這樣。
至此,整個互聯網的五層結構,自下而上所有講完了。這是從系統的角度,解釋互聯網是如何構成的。
先對前面的內容,作一個小結。
咱們已經知道,網絡通訊就是交換數據包。電腦A向電腦B發送一個數據包,後者收到了,回覆一個數據包,從而實現兩臺電腦之間的通訊。數據包的結構,基本上是下面這樣:
發送這個包,須要知道兩個地址:
對方的MAC地址
對方的IP地址
有了這兩個地址,數據包才能準確送到接收者手中。可是,前面說過,MAC地址有侷限性,若是兩臺電腦不在同一個子網絡,就沒法知道對方的MAC地址,必須經過網關(gateway)轉發。
上圖中,1號電腦要向4號電腦發送一個數據包。它先判斷4號電腦是否在同一個子網絡,結果發現不是(後文介紹判斷方法),因而就把這個數據包發到網關A。網關A經過路由協議,發現4號電腦位於子網絡B,又把數據包發給網關B,網關B再轉發到4號電腦。
1號電腦把數據包發到網關A,必須知道網關A的MAC地址。因此,數據包的目標地址,實際上分紅兩種狀況:
場景 | 數據包地址 |
---|---|
同一個子網絡 | 對方的MAC地址,對方的IP地址 |
非同一個子網絡 | 網關的MAC地址,對方的IP地址 |
路由協議主要運行於路由器上,路由協議是用來肯定到達路徑的,它包括RIP,IGRP(Cisco私有協議),
EIGRP(Cisco私有協議),OSPF,IS-IS,BGP。起到一個地圖導航,負責找路的做用。它工做在網絡層。
複製代碼
工做原理:
如圖爲接入互聯網的兩個局域網,分別屬於Router1和Router2。此時ip爲1.1的終端須要發送一個數據包到ip地址爲4.2的主機,主機1.1會先將數據打包,並在包頭報文中寫明源地址1.1和目的地址4.2,當這個數據包發送到網關(此處爲Router1)中時,網關查看到此數據包目的地址4.2屬於4.0網段的地址,故在自身存儲的路由表中查找到4.0網段應從S0接口轉發,此時數據包從Router1的S0接口發出。
當數據包到達Router2處,Router2查看到此數據包目的地址爲本身子網地址,在自身存儲的路由表查找4.0網段應從E0口轉發,此時數據包從Router2的E0口發出,ip爲4.2的主機檢測到有發向本身的數據包後對其進行接收,至此一個數據包的傳輸結束。
發送數據包以前,電腦必須判斷對方是否在同一個子網絡,而後選擇相應的MAC地址。接下來,咱們就來看,實際使用中,這個過程是怎麼完成的。
你買了一臺新電腦,插上網線,開機,這時電腦可以上網嗎?
一般你必須作一些設置。有時,管理員(或者ISP)會告訴你下面四個參數,你把它們填入操做系統,計算機就能連上網了:
本機的IP地址
子網掩碼
DNS的IP地址
網關的IP地址
下圖是Windows系統的設置窗口。
這四個參數缺一不可,後文會解釋爲何須要知道它們才能上網。因爲它們是給定的,計算機每次開機,都會分到一樣的IP地址,因此這種狀況被稱做」靜態IP地址上網」。
可是,這樣的設置很專業,普通用戶望而生畏,並且若是一臺電腦的IP地址保持不變,其餘電腦就不能使用這個地址,不夠靈活。出於這兩個緣由,大多數用戶使用」動態IP地址上網」。
所謂」動態IP地址」,指計算機開機後,會自動分配到一個IP地址,不用人爲設定。它使用的協議叫作DHCP協議
這個協議規定,每個子網絡中,有一臺計算機負責管理本網絡的全部IP地址,它叫作」DHCP服務器」。新的計算機加入網絡,必須向」DHCP服務器」發送一個」DHCP請求」數據包,申請IP地址和相關的網絡參數。
前面說過,若是兩臺計算機在同一個子網絡,必須知道對方的MAC地址和IP地址,才能發送數據包。可是,新加入的計算機不知道這兩個地址,怎麼發送數據包呢?
DHCP協議作了一些巧妙的規定。
首先,它是一種應用層協議,創建在UDP協議之上,因此整個數據包是這樣的:
(1)最前面的」以太網標頭」,設置發出方(本機)的MAC地址和接收方(DHCP服務器)的MAC地址。前者就是本機網卡的MAC地址,後者這時不知道,就填入一個廣播地址:FF-FF-FF-FF-FF-FF。
(2)後面的」IP標頭」,設置發出方的IP地址和接收方的IP地址。這時,對於這二者,本機都不知道。因而,發出方的IP地址就設爲0.0.0.0,接收方的IP地址設爲255.255.255.255。
這個數據包構造完成後,就能夠發出了。以太網是廣播發送,同一個子網絡的每臺計算機都收到了這個包。由於接收方的MAC地址是FF-FF-FF-FF-FF-FF,看不出是發給誰的,因此每臺收到這個包的計算機,還必須分析這個包的IP地址,才能肯定是否是發給本身的。當看到發出方IP地址是0.0.0.0,接收方是255.255.255.255,因而DHCP服務器知道」這個包是發給個人」,而其餘計算機就能夠丟棄這個包。
接下來,DHCP服務器讀出這個包的數據內容,分配好IP地址,發送回去一個」DHCP響應」數據包。這個響應包的結構也是相似的,以太網標頭的MAC地址是雙方的網卡地址,IP標頭的IP地址是DHCP服務器的IP地址(發出方)和255.255.255.255(接收方),UDP標頭的端口是67(發出方)和68(接收方),分配給請求端的IP地址和本網絡的具體參數則包含在Data部分。
新加入的計算機收到這個響應包,因而就知道了本身的IP地址、子網掩碼、網關地址、DNS服務器等等參數。
這個部分,須要記住的就是一點:無論是」靜態IP地址」仍是」動態IP地址」,電腦上網的首要步驟,是肯定四個參數。這四個值很重要,值得重複一遍:
本機的IP地址
子網掩碼
DNS的IP地址
網關的IP地址
有了這幾個數值,電腦就能夠上網」衝浪」了。接下來,咱們來看一個實例,當用戶訪問網頁的時候,互聯網協議是怎麼運做的。
咱們假定,通過上一節的步驟,用戶設置好了本身的網絡參數:
本機的IP地址:192.168.1.100
子網掩碼:255.255.255.0
DNS的IP地址:8.8.8.8
網關的IP地址:192.168.1.1
而後他打開瀏覽器,想要訪問Google,在地址欄輸入了網址:www.google.com。
這意味着,瀏覽器要向Google發送一個網頁請求的數據包。
咱們知道,發送數據包,必需要知道對方的IP地址。可是,如今,咱們只知道網址www.google.com,不知道它的IP地址。
DNS協議能夠幫助咱們,將這個網址轉換成IP地址。已知DNS服務器爲8.8.8.8,因而咱們向這個地址發送一個DNS數據包(53端口)。
而後,DNS服務器作出響應,告訴咱們Google的IP地址是172.194.72.105。因而,咱們知道了對方的IP地址。
接下來,咱們要判斷,這個IP地址是否是在同一個子網絡,這就要用到子網掩碼。
已知子網掩碼是255.255.255.0,本機用它對本身的IP地址192.168.1.100,作一個二進制的AND運算(兩個數位都爲1,結果爲1,不然爲0),計算結果爲192.168.1.0;而後對Google的IP地址172.194.72.105也作一個AND運算,計算結果爲172.194.72.0。這兩個結果不相等,因此結論是,Google與本機不在同一個子網絡。
所以,咱們要向Google發送數據包,必須經過網關192.168.1.1轉發,也就是說,接收方的MAC地址將是網關的MAC地址。
瀏覽網頁用的是HTTP協議,它的整個數據包構造是這樣的:
HTTP部分的內容,相似於下面這樣:
咱們假定這個部分的長度爲4960字節,它會被嵌在TCP數據包之中。
TCP數據包須要設置端口,接收方(Google)的HTTP端口默認是80,發送方(本機)的端口是一個隨機生成的1024-65535之間的整數,假定爲51775。
TCP數據包的標頭長度爲20字節,加上嵌入HTTP的數據包,總長度變爲4980字節。
而後,TCP數據包再嵌入IP數據包。IP數據包須要設置雙方的IP地址,這是已知的,發送方是192.168.1.100(本機),接收方是172.194.72.105(Google)。
IP數據包的標頭長度爲20字節,加上嵌入的TCP數據包,總長度變爲5000字節。
最後,IP數據包嵌入以太網數據包。以太網數據包須要設置雙方的MAC地址,發送方爲本機的網卡MAC地址,接收方爲網關192.168.1.1的MAC地址(經過ARP協議獲得)。
以太網數據包的數據部分,最大長度爲1500字節,而如今的IP數據包長度爲5000字節。所以,IP數據包必須分割成四個包。由於每一個包都有本身的IP標頭(20字節),因此四個包的IP數據包的長度分別爲1500、1500、1500、560。
通過多個網關的轉發,Google的服務器172.194.72.105,收到了這四個以太網數據包。
根據IP標頭的序號,Google將四個包拼起來,取出完整的TCP數據包,而後讀出裏面的」HTTP請求」,接着作出」HTTP響應」,再用TCP協議發回來。
本機收到HTTP響應之後,就能夠將網頁顯示出來,完成一次網絡通訊。