分佈式架構基石-TCP通訊協議

爲何會有TCP/IP協議

在世界上各地,各類各樣的電腦運行着各自不一樣的操做系統爲你們服務,這些電腦在表達同一種信息的時候所使用的方法是千差萬別。就好像聖經中上帝打亂了各地人的口音,讓他們沒法合做同樣。計算機使用者意識到,計算機只是單兵做戰並不會發揮太大的做用。只有把它們聯合起來,電腦纔會發揮出它最大的潛力。因而人們就千方百計的用電線把電腦鏈接到了一塊兒。編程

可是簡單的連到一塊兒是遠遠不夠的,就好像語言不一樣的兩我的互相見了面,徹底不能交流信息。於是他們須要定義一些共通的東西來進行交流,TCP/IP就是爲此而生。TCP/IP不是一個協議,而是一個協議族的統稱。裏面包括了IP協議,IMCP協議,TCP協議,以及咱們更加熟悉的http、ftp、pop3協議等等。電腦有了這些,就好像學會了外語同樣,就能夠和其餘的計算機終端作自由的交流了。瀏覽器

TCP/IP協議分層

TCP/IP協議族按照層次由上到下,層層包裝。bash

應用層:
向用戶提供一組經常使用的應用程序,好比電子郵件、文件傳輸訪問、遠程登陸等。遠程登陸TELNET使用TELNET協議提供在網絡其它主機上註冊的接口。TELNET會話提供了基於字符的虛擬終端。文件傳輸訪問FTP使用FTP協議來提供網絡內機器間的文件拷貝功能。服務器

傳輸層:
提供應用程序間的通訊。其功能包括:1、格式化信息流;2、提供可靠傳輸。爲實現後者,傳輸層協議規定接收端必須發回確認,而且假如分組丟失,必須從新發送。網絡

網絡層
負責相鄰計算機之間的通訊。其功能包括三方面。
1、處理來自傳輸層的分組發送請求,收到請求後,將分組裝入IP數據報,填充報頭,選擇去往信宿機的路徑,而後將數據報發往適當的網絡接口。socket

2、處理輸入數據報:首先檢查其合法性,而後進行尋徑--假如該數據報已到達信宿機,則去掉報頭,將剩下部分交給適當的傳輸協議;假如該數據報還沒有到達信宿,則轉發該數據報。spa

3、處理路徑、流控、擁塞等問題。操作系統

網絡接口層
這是TCP/IP軟件的最低層,負責接收IP數據報並經過網絡發送之,或者從網絡上接收物理幀,抽出IP數據報,交給IP層。翻譯

IP 是無鏈接的

IP 用於計算機之間的通訊。指針

IP 是無鏈接的通訊協議。它不會佔用兩個正在通訊的計算機之間的通訊線路。這樣,IP 就下降了對網絡線路的需求。每條線能夠同時知足許多不一樣的計算機之間的通訊須要。

經過 IP,消息(或者其餘數據)被分割爲小的獨立的包,並經過因特網在計算機之間傳送。

IP 負責將每一個包路由至它的目的地。

IP地址

每一個計算機必須有一個 IP 地址纔可以連入因特網。

每一個 IP 包必須有一個地址纔可以發送到另外一臺計算機。

網絡上每個節點都必須有一個獨立的Internet地址(也叫作IP地址)。如今,一般使用的IP地址是一個32bit的數字,也就是咱們常說的IPv4標準,這32bit的數字分紅四組,也就是常見的255.255.255.255的樣式。IPv4標準上,地址被分爲五類,咱們經常使用的是B類地址。具體的分類請參考其餘文檔。須要注意的是IP地址是網絡號+主機號的組合,這很是重要。

CP/IP 使用 32 個比特來編址。一個計算機字節是 8 比特。因此 TCP/IP 使用了 4 個字節。
一個計算機字節能夠包含 256 個不一樣的值:
00000000、0000000一、000000十、000000十一、00000100、0000010一、000001十、000001十一、00001000 ....... 直到 11111111。
如今,你知道了爲何 TCP/IP 地址是介於 0 到 255 之間的 4 個數字。

IP地址

每一個計算機必須有一個 IP 地址纔可以連入因特網。

每一個 IP 包必須有一個地址纔可以發送到另外一臺計算機。

網絡上每個節點都必須有一個獨立的Internet地址(也叫作IP地址)。如今,一般使用的IP地址是一個32bit的數字,也就是咱們常說的IPv4標準,這32bit的數字分紅四組,也就是常見的255.255.255.255的樣式。IPv4標準上,地址被分爲五類,咱們經常使用的是B類地址。具體的分類請參考其餘文檔。須要注意的是IP地址是網絡號+主機號的組合,這很是重要。

CP/IP 使用 32 個比特來編址。一個計算機字節是 8 比特。因此 TCP/IP 使用了 4 個字節。
一個計算機字節能夠包含 256 個不一樣的值:
00000000、0000000一、000000十、000000十一、00000100、0000010一、000001十、000001十一、00001000 ....... 直到 11111111。
如今,你知道了爲何 TCP/IP 地址是介於 0 到 255 之間的 4 個數字。

IP 路由器

當一個 IP 包從一臺計算機被髮送,它會到達一個 IP 路由器。

IP 路由器負責將這個包路由至它的目的地,直接地或者經過其餘的路由器。

在一個相同的通訊中,一個包所經由的路徑可能會和其餘的包不一樣。而路由器負責根據通訊量、網絡中的錯誤或者其餘參數來進行正確地尋址。

域名

12 個阿拉伯數字很難記憶。使用一個名稱更容易。

用於 TCP/IP 地址的名字被稱爲域名。w3school.com.cn 就是一個域名。

當你鍵入一個像 http://www.w3school.com.cn 這樣的域名,域名會被一種 DNS 程序翻譯爲數字。

在全世界,數量龐大的 DNS 服務器被連入因特網。DNS 服務器負責將域名翻譯爲 TCP/IP 地址,同時負責使用新的域名信息更新彼此的系統。

當一個新的域名連同其 TCP/IP 地址一同註冊後,全世界的 DNS 服務器都會對此信息進行更新。

TCP/IP

TCP/IP 意味着 TCP 和 IP 在一塊兒協同工做。

TCP 負責應用軟件(好比你的瀏覽器)和網絡軟件之間的通訊。

IP 負責計算機之間的通訊。

TCP 負責將數據分割並裝入 IP 包,而後在它們到達的時候從新組合它們。

IP 負責將包發送至接受者。

TCP報文格式

TCP報文格式1.jpg

16位源端口號:16位的源端口中包含初始化通訊的端口。源端口和源IP地址的做用是標識報文的返回地址。

16位目的端口號:16位的目的端口域定義傳輸的目的。這個端口指明報文接收計算機上的應用程序地址接口。

32位序號:32位的序列號由接收端計算機使用,從新分段的報文成最初形式。當SYN出現,序列碼其實是初始序列碼(Initial Sequence Number,ISN),而第一個數據字節是ISN+1。這個序列號(序列碼)可用來補償傳輸中的不一致。

32位確認序號:32位的序列號由接收端計算機使用,重組分段的報文成最初形式。若是設置了ACK控制位,這個值表示一個準備接收的包的序列碼。

4位首部長度:4位包括TCP頭大小,指示何處數據開始。

保留(6位):6位值域,這些位必須是0。爲了未來定義新的用途而保留。

標誌:6位標誌域。表示爲:緊急標誌、有意義的應答標誌、推、重置鏈接標誌、同步序列號標誌、完成發送數據標誌。按照順序排列是:URG、ACK、PSH、RST、SYN、FIN。

16位窗口大小:用來表示想收到的每一個TCP數據段的大小。TCP的流量控制由鏈接的每一端經過聲明的窗口大小來提供。窗口大小爲字節數,起始於確認序號字段指明的值,這個值是接收端正指望接收的字節。窗口大小是一個16字節字段,於是窗口大小最大爲65535字節。

16位校驗和:16位TCP頭。源機器基於數據內容計算一個數值,收信息機要與源機器數值 結果徹底同樣,從而證實數據的有效性。檢驗和覆蓋了整個的TCP報文段:這是一個強制性的字段,必定是由發送端計算和存儲,並由接收端進行驗證的。

16位緊急指針:指向後面是優先數據的字節,在URG標誌設置了時纔有效。若是URG標誌沒有被設置,緊急域做爲填充。加快處理標示爲緊急的數據段。

選項:長度不定,但長度必須爲1個字節。若是沒有選項就表示這個1字節的域等於0。

數據:該TCP協議包負載的數據。

在上述字段中,6位標誌域的各個選項功能以下。

URG:緊急標誌。緊急標誌爲"1"代表該位有效。

ACK:確認標誌。代表確認編號欄有效。大多數狀況下該標誌位是置位的。TCP報頭內的確認編號欄內包含的確認編號(w+1)爲下一個預期的序列編號,同時提示遠端系統已經成功接收全部數據。

PSH:推標誌。該標誌置位時,接收端不將該數據進行隊列處理,而是儘量快地將數據轉由應用處理。在處理Telnet或rlogin等交互模式的鏈接時,該標誌老是置位的。

RST:復位標誌。用於復位相應的TCP鏈接。

SYN:同步標誌。代表同步序列編號欄有效。該標誌僅在三次握手創建TCP鏈接時有效。它提示TCP鏈接的服務端檢查序列編號,該序列編號爲TCP鏈接初始端(通常是客戶端)的初始序列編號。在這裏,能夠把TCP序列編號看做是一個範圍從0到4,294,967,295的32位計數器。經過TCP鏈接交換的數據中每個字節都通過序列編號。在TCP報頭中的序列編號欄包括了TCP分段中第一個字節的序列編號。

FIN:結束標誌。

TCP三次握手

所謂三次握手(Three-Way Handshake)即創建TCP鏈接,就是指創建一個TCP鏈接時,須要客戶端和服務端總共發送3個包以確認鏈接的創建。在socket編程中,這一過程由客戶端執行connect來觸發,整個流程以下圖所示:

TCP三次握手.png

(1)第一次握手:Client將標誌位SYN置爲1,隨機產生一個值seq=J,並將該數據包發送給Server,Client進入SYN_SENT狀態,等待Server確認。

(2)第二次握手:Server收到數據包後由標誌位SYN=1知道Client請求創建鏈接,Server將標誌位SYN和ACK都置爲1,ack=J+1,隨機產生一個值seq=K,並將該數據包發送給Client以確認鏈接請求,Server進入SYN_RCVD狀態。

(3)第三次握手:Client收到確認後,檢查ack是否爲J+1,ACK是否爲1,若是正確則將標誌位ACK置爲1,ack=K+1,並將該數據包發送給Server,Server檢查ack是否爲K+1,ACK是否爲1,若是正確則鏈接創建成功,Client和Server進入ESTABLISHED狀態,完成三次握手,隨後Client與Server之間能夠開始傳輸數據了。

簡單來講,就是

一、創建鏈接時,客戶端發送SYN包(SYN=i)到服務器,並進入到SYN-SEND狀態,等待服務器確認

二、服務器收到SYN包,必須確認客戶的SYN(ack=i+1),同時本身也發送一個SYN包(SYN=k),即SYN+ACK包,此時服務器進入SYN-RECV狀態

三、客戶端收到服務器的SYN+ACK包,向服務器發送確認報ACK(ack=k+1),此包發送完畢,客戶端和服務器進入ESTABLISHED狀態,完成三次握手,客戶端與服務器開始傳送數據。

SYN攻擊

在三次握手過程當中,Server發送SYN-ACK以後,收到Client的ACK以前的TCP鏈接稱爲半鏈接(half-open connect),此時Server處於SYN_RCVD狀態,當收到ACK後,Server轉入ESTABLISHED狀態。SYN攻擊就是Client在短期內僞造大量不存在的IP地址,並向Server不斷地發送SYN包,Server回覆確認包,並等待Client的確認,因爲源地址是不存在的,所以,Server須要不斷重發直至超時,這些僞造的SYN包將產時間佔用未鏈接隊列,致使正常的SYN請求由於隊列滿而被丟棄,從而引發網絡堵塞甚至系統癱瘓。SYN攻擊時一種典型的DDOS攻擊,檢測SYN攻擊的方式很是簡單,即當Server上有大量半鏈接狀態且源IP地址是隨機的,則能夠判定遭到SYN攻擊了,使用以下命令可讓之現行:

#netstat -nap | grep SYN_RECV
複製代碼

TCP四次揮手

所謂四次揮手(Four-Way Wavehand)即終止TCP鏈接,就是指斷開一個TCP鏈接時,須要客戶端和服務端總共發送4個包以確認鏈接的斷開。在socket編程中,這一過程由客戶端或服務端任一方執行close來觸發,整個流程以下圖所示:

TCP四次揮手.png

因爲TCP鏈接時全雙工的,所以,每一個方向都必需要單獨進行關閉,這一原則是當一方完成數據發送任務後,發送一個FIN來終止這一方向的鏈接,收到一個FIN只是意味着這一方向上沒有數據流動了,即不會再收到數據了,可是在這個TCP鏈接上仍然可以發送數據,直到這一方向也發送了FIN。首先進行關閉的一方將執行主動關閉,而另外一方則執行被動關閉,上圖描述的便是如此。

(1)第一次揮手:Client發送一個FIN,用來關閉Client到Server的數據傳送,Client進入FIN_WAIT_1狀態。

(2)第二次揮手:Server收到FIN後,發送一個ACK給Client,確認序號爲收到序號+1(與SYN相同,一個FIN佔用一個序號),Server進入CLOSE_WAIT狀態。

(3)第三次揮手:Server發送一個FIN,用來關閉Server到Client的數據傳送,Server進入LAST_ACK狀態。

(4)第四次揮手:Client收到FIN後,Client進入TIME_WAIT狀態,接着發送一個ACK給Server,確認序號爲收到序號+1,Server進入CLOSED狀態,完成四次揮手。

爲何創建鏈接是三次握手,而關閉鏈接倒是四次揮手呢?

這是由於服務端在LISTEN狀態下,收到創建鏈接請求的SYN報文後,把ACK和SYN放在一個報文裏發送給客戶端。而關閉鏈接時,當收到對方的FIN報文時,僅僅表示對方再也不發送數據了可是還能接收數據,己方也未必所有數據都發送給對方了,因此己方能夠當即close,也能夠發送一些數據給對方後,再發送FIN報文給對方來表示贊成如今關閉鏈接,所以,己方ACK和FIN通常都會分開發送。

爲何TIME_WAIT狀態須要通過2MSL(最大報文段生存時間)才能返回到CLOSE狀態?

緣由有二:
1、保證TCP協議的全雙工鏈接可以可靠關閉
2、保證此次鏈接的重複數據段從網絡中消失

先說第一點,若是Client直接CLOSED了,那麼因爲IP協議的不可靠性或者是其它網絡緣由,致使Server沒有收到Client最後回覆的ACK。那麼Server就會在超時以後繼續發送FIN,此時因爲Client已經CLOSED了,就找不到與重發的FIN對應的鏈接,最後Server就會收到RST而不是ACK,Server就會覺得是鏈接錯誤把問題報告給高層。這樣的狀況雖然不會形成數據丟失,可是卻致使TCP協議不符合可靠鏈接的要求。因此,Client不是直接進入CLOSED,而是要保持TIME_WAIT,當再次收到FIN的時候,可以保證對方收到ACK,最後正確的關閉鏈接。

再說第二點,若是Client直接CLOSED,而後又再向Server發起一個新鏈接,咱們不能保證這個新鏈接與剛關閉的鏈接的端口號是不一樣的。也就是說有可能新鏈接和老鏈接的端口號是相同的。通常來講不會發生什麼問題,可是仍是有特殊狀況出現:假設新鏈接和已經關閉的老鏈接端口號是同樣的,若是前一次鏈接的某些數據仍然滯留在網絡中,這些延遲數據在創建新鏈接以後纔到達Server,因爲新鏈接和老鏈接的端口號是同樣的,又由於TCP協議判斷不一樣鏈接的依據是socket pair,因而,TCP協議就認爲那個延遲的數據是屬於新鏈接的,這樣就和真正的新鏈接的數據包發生混淆了。因此TCP鏈接還要在TIME_WAIT狀態等待2倍MSL,這樣能夠保證本次鏈接的全部數據都從網絡中消失。

相關文章
相關標籤/搜索