TCP/IP 狀態機,以下圖所示:linux
在TCP/IP協議中,TCP協議提供可靠的鏈接服務,採用三次握手創建一個鏈接,如圖1所示。 (SYN包表示標誌位syn=1,ACK包表示標誌位ack=1,SYN+ACK包表示標誌位syn=1,ack=1)ubuntu
(1) 第一次握手:創建鏈接時,客戶端A發送SYN包(SEQ_NUMBER=j)到服務器B,並進入SYN_SEND狀態,等待服務器B確認。windows
(2) 第二次握手:服務器B收到SYN包,必須確認客戶A的SYN(ACK_NUMBER=j+1),同時本身也發送一個SYN包(SEQ_NUMBER=k),即SYN+ACK包,此時服務器B進入SYN_RECV狀態。安全
(3) 第三次握手:客戶端A收到服務器B的SYN+ACK包,向服務器B發送確認包ACK(ACK_NUMBER=k+1),此包發送完畢,客戶端A和服務器B進入ESTABLISHED狀態,完成三次握手。服務器
完成三次握手,客戶端與服務器開始傳送數據。網絡
圖1 TCP三次握手創建鏈接併發
因爲TCP鏈接是全雙工的,所以每一個方向都必須單獨進行關閉。這個原則是當一方完成它的數據發送任務後就能發送一個FIN來終止這個方向的鏈接。收到一個 FIN只意味着這一方向上沒有數據流動,一個TCP鏈接在收到一個FIN後仍能發送數據。首先進行關閉的一方將執行主動關閉,而另外一方執行被動關閉。socket
(1)客戶端A發送一個FIN,用來關閉客戶A到服務器B的數據傳送(報文段4)。ide
(2)服務器B收到這個FIN,它發回一個ACK,確認序號爲收到的序號加1(報文段5)。和SYN同樣,一個FIN將佔用一個序號。ui
(3)服務器B關閉與客戶端A的鏈接,發送一個FIN給客戶端A(報文段6)。
(4)客戶端A發回ACK報文確認,並將確認序號設置爲收到序號加1(報文段7)。
TCP採用四次揮手關閉鏈接如圖2所示。
PS:另外一個關閉鏈接的圖
1.爲何創建鏈接協議是三次握手,而關閉鏈接倒是四次握手呢?
這是由於服務端的LISTEN狀態下的SOCKET當收到SYN報文的鏈接請求後,它能夠把ACK和SYN(ACK起應 答做用,而SYN起同步做用)放在一個報文裏來發送。但關閉鏈接時,當收到對方的FIN報文通知時,它僅僅表示對方沒有數據發送給你了;但未必你全部的數 據都所有發送給對方了,因此你可能未必會立刻會關閉SOCKET,也即你可能還須要發送一些數據給對方以後,再發送FIN報文給對方來表示你贊成如今能夠 關閉鏈接了,因此它這裏的ACK報文和FIN報文多數狀況下都是分開發送的。
2.爲何TIME_WAIT狀態還須要等2MSL後才能返回到CLOSED狀態?
這是由於雖然雙方都贊成關閉鏈接了,並且握手的4個報文也都協調和發送完畢,按理能夠直接回到CLOSED狀態(就比如 從SYN_SEND狀態到ESTABLISH狀態那樣);可是由於咱們必需要假想網絡是不可靠的,你沒法保證你最後發送的ACK報文會必定被對方收到,因 此對方處於LAST_ACK狀態下的SOCKET可能會由於超時未收到ACK報文,而重發FIN報文,因此這個TIME_WAIT狀態的做用就是用來重發 可能丟失的ACK報文。
3. 爲何不能用兩次握手進行鏈接?
咱們知道,3次握手完成兩個重要的功能,既要雙方作好發送數據的準備工做(雙方都知道彼此已準備好),也要容許雙方就初始序列號進行協商,這個序列號在握手過程當中被髮送和確認。
如今把三次握手改爲僅須要兩次握手,死鎖是可能發生的。做爲例子,考慮計算機S和C之間的通訊,假定C給S發送一個鏈接請求分組,S收到了這個分組,併發 送了確認應答分組。按照兩次握手的協定,S認爲鏈接已經成功地創建了,能夠開始發送數據分組。但是,C在S的應答分組在傳輸中被丟失的狀況下,將不知道S 是否已準備好,不知道S創建什麼樣的序列號,C甚至懷疑S是否收到本身的鏈接請求分組。在這種狀況下,C認爲鏈接還未創建成功,將忽略S發來的任何數據分 組,只等待鏈接確認應答分組。而S在發出的分組超時後,重複發送一樣的分組。這樣就造成了死鎖。
補充:
a. 默認狀況下(不改變socket選項),當你調用close( or closesocket,如下說close再也不重複)時,若是發送緩衝中還有數據,TCP會繼續把數據發送完。
b. 發送了FIN只是表示這端不能繼續發送數據(應用層不能再調用send發送),可是還能夠接收數據。
c. 應用層如何知道對端關閉?一般,在最簡單的阻塞模型中,當你調用recv時,若是返回0,則表示對端關閉。在這個時候一般的作法就是也調用close,那 麼TCP層就發送FIN,繼續完成四次握手。若是你不調用close,那麼對端就會處於FIN_WAIT_2狀態,而本端則會處於CLOSE_WAIT狀 態。這個能夠寫代碼試試。
d. 在不少時候,TCP鏈接的斷開都會由TCP層自動進行,例如你CTRL+C終止你的程序,TCP鏈接依然會正常關閉,你能夠寫代碼試試。
插曲:
特別的TIME_WAIT狀態:
從以上TCP鏈接關閉的狀態轉換圖能夠看出,主動關閉的一方在發送完對對方FIN報文的確認(ACK)報文後,會進入TIME_WAIT狀態。TIME_WAIT狀態也稱爲2MSL狀態。
什麼是2MSL?MSL即Maximum Segment Lifetime,也就是報文最大生存時間,引用《TCP/IP詳解》中的話:「它(MSL)是任何報文段被丟棄前在網絡內的最長時間。」那麼,2MSL 也就是這個時間的2倍。其實我以爲不必把這個MSL的確切含義搞明白,你所須要明白的是,當TCP鏈接完成四個報文段的交換時,主動關閉的一方將繼續等 待必定時間(2-4分鐘),即便兩端的應用程序結束。你能夠寫代碼試試,而後用setstat查看下。
爲何須要2MSL?根據《TCP/IP詳解》和《The TCP/IP Guide》中的說法,有兩個緣由:
其一,保證發送的ACK會成功發送到對方,如何保證?我以爲多是經過超時計時器發送。這個就很難用代碼演示了。
其二,報文可能會被混淆,意思是說,其餘時候的鏈接可能會被看成本次的鏈接。直接引用《The TCP/IP Guide》的說法:The second is to provide a 「buffering period」 between the end of this connection and any subsequent ones. If not for this period, it is possible that packets from different connections could be mixed, creating confusion.
TIME_WAIT狀態所帶來的影響:(1到4分鐘)
當某個鏈接的一端處於TIME_WAIT狀態時,該鏈接將不能再被使用。事實上,對於咱們比較有現實意義的是,這個端口將不能再被使用。某個端口處於 TIME_WAIT狀態(其實應該是這個鏈接)時,這意味着這個TCP鏈接並無斷開(徹底斷開),那麼,若是你bind這個端口,就會失敗。對於服務器 而言,若是服務器忽然crash掉了,那麼它將沒法在2MSL內從新啓動,由於bind會失敗。解決這個問題的一個方法就是設置socket的 SO_REUSEADDR選項。這個選項意味着你能夠重用一個地址。
對於TIME_WAIT的插曲:
當創建一個TCP鏈接時,服務器端會繼續用原有端口監聽,同時用這個端口與客戶端通訊。而客戶端默認狀況下會使用一個隨機端口與服務器端的監聽端口通訊。 有時候,爲了服務器端的安全性,咱們須要對客戶端進行驗證,即限定某個IP某個特定端口的客戶端。客戶端可使用bind來使用特定的端口。對於服務器 端,當設置了SO_REUSEADDR選項時,它能夠在2MSL內啓動並listen成功。可是對於客戶端,當使
用bind並設置SO_REUSEADDR時,若是在2MSL內啓動,雖然bind會成功,可是在windows平臺上connect會失敗。而在linux上則不存在這個問題。(個人實驗平臺:winxp, ubuntu7.10)
要解決windows平臺的這個問題,能夠設置SO_LINGER選項。SO_LINGER選項決定調用close時TCP的行爲。SO_LINGER涉及到linger結構體,若是設置結構體中l_onoff爲非0,l_linger爲0,那麼調用close時TCP鏈接會馬上斷開,TCP不會將發送緩衝中未發送的數據發送,而是當即發送一個RST報文給對方,這個時候TCP鏈接(關閉時)就不會進入TIME_WAIT狀態。如你所見,這樣作雖然解決了問題,可是並不安全。經過以上方式設置SO_LINGER狀態,等同於設置SO_DONTLINGER狀態。
斷開鏈接時的意外:
這個算不上斷開鏈接時的意外,當TCP鏈接發生一些物理上的意外狀況時,例如網線斷開,linux上的TCP實現會依然認爲該鏈接有效,而windows 則會在必定時間後返回錯誤信息。這彷佛能夠經過設置SO_KEEPALIVE選項來解決,不過不知道這個選項是否對於全部平臺都有效。