HTTP協議結構，get post 區別-HTTP狀態碼(阿里)

時間 2019-11-20

標籤 http 協議結構 post 區別狀態阿里欄目 HTTP/TCP 简体版

原文原文鏈接

若是須要想了解相關的TCP的協議結構，底層架構，以及每次面試必問的三次握手，四次揮手能夠php

TCP三次握手，四次揮手參考：三次握手，四次揮手具體發送的報文和狀態都要掌握(阿里)html

四層協議的參考：七層協議和四層協議（阿里）java

HTTP簡介

HTTP協議是Hyper Text Transfer Protocol（超文本傳輸協議）的縮寫,是用於從萬維網（WWW:World Wide Web ）服務器傳輸超文本到本地瀏覽器的傳送協議。web

HTTP是一個基於TCP/IP通訊協議來傳遞數據（HTML 文件, 圖片文件, 查詢結果等）。面試

HTTP是一個屬於應用層的面向對象的協議，因爲其簡捷、快速的方式，適用於分佈式超媒體信息系統。它於1990年提出，通過幾年的使用與發展，獲得不斷地完善和擴展。目前在WWW中使用的是HTTP/1.0的第六版，HTTP/1.1的規範化工做正在進行之中，並且HTTP-NG(Next Generation of HTTP)的建議已經提出。sql

HTTP協議工做於客戶端-服務端架構爲上。瀏覽器做爲HTTP客戶端經過URL向HTTP服務端即WEB服務器發送全部請求。Web服務器根據接收到的請求後，向客戶端發送響應信息。瀏覽器

http請求-響應模型.jpg

主要特色

一、簡單快速：客戶向服務器請求服務時，只需傳送請求方法和路徑。請求方法經常使用的有GET、HEAD、POST。每種方法規定了客戶與服務器聯繫的類型不一樣。因爲HTTP協議簡單，使得HTTP服務器的程序規模小，於是通訊速度很快。緩存

二、靈活：HTTP容許傳輸任意類型的數據對象。正在傳輸的類型由Content-Type加以標記。安全

3.無鏈接：無鏈接的含義是限制每次鏈接只處理一個請求。服務器處理完客戶的請求，並收到客戶的應答後，即斷開鏈接。採用這種方式能夠節省傳輸時間。服務器

4.無狀態：HTTP協議是無狀態協議。無狀態是指協議對於事務處理沒有記憶能力。缺乏狀態意味着若是後續處理須要前面的信息，則它必須重傳，這樣可能致使每次鏈接傳送的數據量增大。另外一方面，在服務器不須要先前信息時它的應答就較快。關於如何保存狀態，須要用到Session和Cookie 具體參考：Session, Cookie區別
五、支持B/S及C/S模式。

HTTP之URL

HTTP使用統一資源標識符（Uniform Resource Identifiers, URI）來傳輸數據和創建鏈接。URL是一種特殊類型的URI，包含了用於查找某個資源的足夠的信息

URL,全稱是UniformResourceLocator, 中文叫統一資源定位符,是互聯網上用來標識某一處資源的地址。如下面這個URL爲例，介紹下普通URL的各部分組成：http://www.aspxfans.com:8080/news/index.asp?boardID=5&ID=24618&page=1#name從上面的URL能夠看出，一個完整的URL包括如下幾部分：

1.協議部分：該URL的協議部分爲「http：」，這表明網頁使用的是HTTP協議。在Internet中可使用多種協議，如HTTP，FTP等等本例中使用的是HTTP協議。在"HTTP"後面的「//」爲分隔符

2.域名部分：該URL的域名部分爲「www.aspxfans.com」。一個URL中，也可使用IP地址做爲域名使用

3.端口部分：跟在域名後面的是端口，域名和端口之間使用「:」做爲分隔符。端口不是一個URL必須的部分，若是省略端口部分，將採用默認端口

4.虛擬目錄部分：從域名後的第一個「/」開始到最後一個「/」爲止，是虛擬目錄部分。虛擬目錄也不是一個URL必須的部分。本例中的虛擬目錄是「/news/」

5.文件名部分：從域名後的最後一個「/」開始到「？」爲止，是文件名部分，若是沒有「?」,則是從域名後的最後一個「/」開始到「#」爲止，是文件部分，若是沒有「？」和「#」，那麼從域名後的最後一個「/」開始到結束，都是文件名部分。本例中的文件名是「index.asp」。文件名部分也不是一個URL必須的部分，若是省略該部分，則使用默認的文件名

6.錨部分：從「#」開始到最後，都是錨部分。本例中的錨部分是「name」。錨部分也不是一個URL必須的部分

7.參數部分：從「？」開始到「#」爲止之間的部分爲參數部分，又稱搜索部分、查詢部分。本例中的參數部分爲「boardID=5&ID=24618&page=1」。參數能夠容許有多個參數，參數與參數之間用「&」做爲分隔符。

URI和URL的區別

URI，是uniform resource identifier，統一資源標識符，用來惟一的標識一個資源。

Web上可用的每種資源如HTML文檔、圖像、視頻片斷、程序等都是一個來URI來定位的
URI通常由三部組成：
①訪問資源的命名機制
②存放資源的主機名
③資源自身的名稱，由路徑表示，着重強調於資源。

URL是uniform resource locator，統一資源定位器，它是一種具體的URI，即URL能夠用來標識一個資源，並且還指明瞭如何locate這個資源。

URL是Internet上用來描述信息資源的字符串，主要用在各類WWW客戶程序和服務器程序上，特別是著名的Mosaic。
採用URL能夠用一種統一的格式來描述各類信息資源，包括文件、服務器的地址和目錄等。URL通常由三部組成：
①協議(或稱爲服務方式)
②存有該資源的主機IP地址(有時也包括端口號)
③主機資源的具體地址。如目錄和文件名等

URN，uniform resource name，統一資源命名，是經過名字來標識資源，好比mailto:java-net@java.sun.com。

URI是以一種抽象的，高層次概念定義統一資源標識，而URL和URN則是具體的資源標識的方式。URL和URN都是一種URI。籠統地說，每一個 URL 都是 URI，但不必定每一個 URI 都是 URL。這是由於 URI 還包括一個子類，即統一資源名稱 (URN)，它命名資源但不指定如何定位資源。上面的 mailto、news 和 isbn URI 都是 URN 的示例。

在Java的URI中，一個URI實例能夠表明絕對的，也能夠是相對的，只要它符合URI的語法規則。而URL類則不只符合語義，還包含了定位該資源的信息，所以它不能是相對的。
在Java類庫中，URI類不包含任何訪問資源的方法，它惟一的做用就是解析。
相反的是，URL類能夠打開一個到達資源的流。

HTTP有兩類報文，請求報文和響應報文

一、HTTP之請求消息Request

1. HTTP請求報文

一個HTTP請求報文由請求行、請求頭部、空行，請求數據（正文）四部分組成。

HTTP請求格式：

<request line>
<headers>
<blank line>
[<request-body>]

在HTTP請求中，第一行必須是一個請求行（request line），用來講明請求類型、要訪問的資源以及使用的HTTP版本。緊接着是一個首部（header）小節，用來講明服務器要使用的附加信息。在首部以後是一個空行，再此以後能夠添加任意的其餘數據[稱之爲主體（body）]。

HTTP request 請求主要是 get 和post， get請求參數在請求行裏面，post的參數封裝在請求體裏面

GET請求報文一個實例：

GET /562f25980001b1b106000338.jpg HTTP/1.1
Host    img.mukewang.com
User-Agent    Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36
Accept    image/webp,image/*,*/*;q=0.8
Referer    http://www.imooc.com/
Accept-Encoding    gzip, deflate, sdch
Accept-Language    zh-CN,zh;q=0.8

1 GET http://weibo.com/signup/signup.php?inviteCode=2388493434  
2 Host: weibo.com  
3 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8

1.1 請求行

GET方法的參數就放在1.1請求行裏面，POST的參數放在了1.4請求體裏面

請求行由請求方法、URL、協議版本號3個部分組成，經常使用的請求方法包括GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、CONNECT；

GET最多見的一種請求方式，當客戶端要從服務器中讀取文檔時，當點擊網頁上的連接或者經過在瀏覽器的地址欄輸入網址來瀏覽網頁的，使用的都是GET方式。

請求行以一個方法符號開頭，用來講明請求類型,要訪問的資源,以空格分開，後面跟着請求的URI和協議的版本。

GET說明請求類型爲GET,[/562f25980001b1b106000338.jpg]爲要訪問的資源，該行的最後一部分說明使用的是HTTP1.1版本。

1.2 請求頭部

從第二行起爲請求頭部，緊接着請求行（即第一行）以後的部分，用來講明服務器要使用的附加信息HOST將指出請求的目的地.請求頭部由關鍵字/值對組成，每行一對，關鍵字和值用英文冒號分割,

User-Agent,服務器端和客戶端腳本都能訪問它,它是瀏覽器類型檢測邏輯的重要基礎.該信息由你的瀏覽器來定義,而且在每一個請求中自動發送等等

1.3 空行，請求頭部後面的空行是必須的

即便第四部分的請求數據爲空，也必須有空行。

1.4 請求正文

GET方法的參數就放在1.1請求行裏面，POST的參數放在了1.4請求體裏面， 請求數據不在GET方法中使用，而是在POST方法中使用。請求數據也叫主體，能夠添加任意的其餘數據。

POST方法適用於須要客戶填寫表單的場合。

與請求數據相關的最常使用的請求頭是Content-Type和Content-Length。

這個例子的請求數據爲空。

另外一個例子：

POST請求例子，使用Charles抓取的request：

1 POST / HTTP1.1
2 Host:www.wrox.com
3 User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022)
4 Content-Type:application/x-www-form-urlencoded
5 Content-Length:40
6 Connection: Keep-Alive
7 
8 name=Professional%20Ajax&publisher=Wiley

第一部分：請求行，第一行明瞭是post請求，以及http1.1版本。

第二部分：請求頭部，第二行至第六行。
第三部分：空行，第七行的空行。
第四部分：請求數據，第八行。也就是密碼等的參數

HTTP之響應消息Response

HTTP響應報文由狀態行、響應頭部、空行，響應正文4個部分組成

HTTP/1.1 200 OK
Date: Fri, 22 May 2009 06:07:21 GMT
Content-Type: text/html; charset=UTF-8

<html>
      <head></head>
      <body>
            <!--body goes here-->
      </body>
</html>

第一部分：狀態行，由HTTP協議版本號， 狀態碼， 狀態消息 三部分組成。

通常狀況下，服務器接收並處理客戶端發過來的請求後會返回一個HTTP的響應消息。

2.1 狀態行
　　狀態行由協議版本號、狀態碼和狀態碼描述3個部分組成，（HTTP/1.1）代表HTTP版本爲1.1版本，狀態碼爲200，狀態消息爲（ok）

2.2 響應頭部
　　響應頭部與請求頭部對應，與請求頭部相似，用來講明客戶端要使用的一些附加信息

　　第二行和第三行爲消息報頭，
　　Date:生成響應的日期和時間；Content-Type:指定了MIME類型的HTML(text/html),編碼類型是UTF-8

2.3 空行
　　消息報頭後面的空行是必須的
2.4 響應正文
　　空行後面的html部分爲響應正文。

HTTP之狀態碼

狀態代碼有三位數字組成，第一個數字定義了響應的類別，共分五種類別:

1xx：指示信息--表示請求已接收，繼續處理

2xx：成功--表示請求已被成功接收、理解、接受

3xx：重定向--要完成請求必須進行更進一步的操做

4xx：客戶端錯誤--請求有語法錯誤或請求沒法實現

5xx：服務器端錯誤--服務器未能實現合法的請求

常見狀態碼：。(美團要求知道常見狀態碼瞭解很多於10個）

200 OK                        //客戶端請求成功
400 Bad Request               //客戶端請求有語法錯誤，不能被服務器所理解
401 Unauthorized              //請求未經受權，這個狀態代碼必須和WWW-Authenticate報頭域一塊兒使用 
403 Forbidden                 //服務器收到請求，可是拒絕提供服務
404 Not Found                 //請求資源不存在，eg：輸入了錯誤的URL
500 Internal Server Error     //服務器發生不可預期的錯誤
503 Server Unavailable        //服務器當前不能處理客戶端的請求，一段時間後可能恢復正常

更多狀態碼參考：HTTP狀態碼

HTTP請求方法

根據HTTP標準，HTTP請求可使用多種請求方法。
HTTP1.0定義了三種請求方法： GET, POST 和 HEAD方法。
HTTP1.1新增了五種請求方法：OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法。

GET     請求指定的頁面信息，並返回實體主體。
HEAD     相似於get請求，只不過返回的響應中沒有具體的內容，用於獲取報頭
POST     向指定資源提交數據進行處理請求（例如提交表單或者上傳文件）。數據被包含在請求體中。POST請求可能會致使新的資源的創建和/或已有資源的修改。
PUT     從客戶端向服務器傳送的數據取代指定的文檔的內容。
DELETE 請求服務器刪除指定的頁面。 CONNECT HTTP/1.1協議中預留給可以將鏈接改成管道方式的代理服務器。 OPTIONS 容許客戶端查看服務器的性能。 TRACE 回顯服務器收到的請求，主要用於測試或診斷。

HTTP工做原理

HTTP協議定義Web客戶端如何從Web服務器請求Web頁面，以及服務器如何把Web頁面傳送給客戶端。HTTP協議採用了請求/響應模型。客戶端向服務器發送一個請求報文，請求報文包含請求的方法、URL、協議版本、請求頭部和請求數據。服務器以一個狀態行做爲響應，響應的內容包括協議的版本、成功或者錯誤代碼、服務器信息、響應頭部和響應數據。

如下是 HTTP 請求/響應的步驟：

一、客戶端鏈接到Web服務器

一個HTTP客戶端，一般是瀏覽器，與Web服務器的HTTP端口（默認爲80）創建一個TCP套接字鏈接。例如，http://www.oakcms.cn。

二、發送HTTP請求

經過TCP套接字，客戶端向Web服務器發送一個文本的請求報文，一個請求報文由請求行、請求頭部、空行和請求數據4部分組成。

三、服務器接受請求並返回HTTP響應

Web服務器解析請求，定位請求資源。服務器將資源複本寫到TCP套接字，由客戶端讀取。一個響應由狀態行、響應頭部、空行和響應數據4部分組成。

四、釋放鏈接TCP鏈接

若connection 模式爲close，則服務器主動關閉TCP鏈接，客戶端被動關閉鏈接，釋放TCP鏈接;若connection 模式爲keepalive，則該鏈接會保持一段時間，在該時間內能夠繼續接收請求;

五、客戶端瀏覽器解析HTML內容

客戶端瀏覽器首先解析狀態行，查看代表請求是否成功的狀態代碼。而後解析每個響應頭，響應頭告知如下爲若干字節的HTML文檔和文檔的字符集。客戶端瀏覽器讀取響應數據HTML，根據HTML的語法對其進行格式化，並在瀏覽器窗口中顯示。

例如：在瀏覽器地址欄鍵入URL，按下回車以後會經歷如下流程：

一、瀏覽器向 DNS 服務器請求解析該 URL 中的域名所對應的 IP 地址;

二、解析出 IP 地址後，根據該 IP 地址和默認端口 80，和服務器創建TCP鏈接;

三、瀏覽器發出讀取文件(URL 中域名後面部分對應的文件)的HTTP 請求，該請求報文做爲 TCP 三次握手的第三個報文的數據發送給服務器;

四、服務器對瀏覽器請求做出響應，並把對應的 html 文本發送給瀏覽器;

五、釋放 TCP鏈接;

六、瀏覽器將該 html 文本並顯示內容; 　　

GET和POST請求的區別

GET請求

1 GET /books/?sex=man&name=Professional HTTP/1.1
2 Host: www.wrox.com
3 User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7.6)
4 Gecko/20050225 Firefox/1.0.1
5 Connection: Keep-Alive

注意最後一行是空行

POST請求

1 POST / HTTP/1.1
2 Host: www.wrox.com
3 User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7.6)
4 Gecko/20050225 Firefox/1.0.1
5 Content-Type: application/x-www-form-urlencoded
6 Content-Length: 40
7 Connection: Keep-Alive
8 
9 name=Professional%20Ajax&publisher=Wiley

一、GET提交，請求的數據會附在URL以後（就是把數據放置在HTTP協議頭中），以?分割URL和傳輸數據，多個參數用&鏈接；例如：login.action?name=hyddd。若是數據是英文字母/數字，原樣發送，若是是空格，轉換爲+，若是是中文/其餘字符，則直接把字符串用BASE64加密，得出如： %E4%BD%A0%E5%A5%BD，其中％XX中的XX爲該符號以16進製表示的ASCII。

POST提交：把提交的數據放置在是HTTP包的包體中。上文示例中紅色字體標明的就是實際的傳輸數據

所以，GET提交的數據會在地址欄中顯示出來，而POST提交，地址欄不會改變

二、傳輸數據的大小：首先聲明：HTTP協議沒有對傳輸的數據大小進行限制，HTTP協議規範也沒有對URL長度進行限制。

而在實際開發中存在的限制主要有：

GET:特定瀏覽器和服務器對URL長度有限制，例如 IE對URL長度的限制是2083字節(2K+35)。對於其餘瀏覽器，如Netscape、FireFox等，理論上沒有長度限制，其限制取決於操做系統的支持。

所以對於GET提交時，傳輸數據就會受到URL長度的限制。

POST:因爲不是經過URL傳值，理論上數據不受限。但實際各個WEB服務器會規定對post提交數據大小進行限制，Apache、IIS6都有各自的配置。

三、安全性

POST的安全性要比GET的安全性高。好比：經過GET提交數據，用戶名和密碼將明文出如今URL上，由於(1)登陸頁面有可能被瀏覽器緩存；(2)其餘人查看瀏覽器的歷史紀錄，那麼別人就能夠拿到你的帳號和密碼了，除此以外，使用GET提交數據還可能會形成Cross-site request forgery攻擊

四、Http get,post,soap協議都是在http上運行的

（1）get：請求參數是做爲一個key/value對的序列（查詢字符串）附加到URL上的
查詢字符串的長度受到web瀏覽器和web服務器的限制（如IE最多支持2048個字符），不適合傳輸大型數據集同時，它很不安全

（2）post：請求參數是在http標題的一個不一樣部分（名爲entity body）傳輸的，這一部分用來傳輸表單信息，所以必須將Content-type設置爲:application/x-www-form- urlencoded。post設計用來支持web窗體上的用戶字段，其參數也是做爲key/value對傳輸。
可是：它不支持複雜數據類型，由於post沒有定義傳輸數據結構的語義和規則。

（3）soap：是http post的一個專用版本，遵循一種特殊的xml消息格式
Content-type設置爲: text/xml 任何數據均可以xml化。

Http協議定義了不少與服務器交互的方法，最基本的有4種，分別是GET,POST,PUT,DELETE. 一個URL地址用於描述一個網絡上的資源，而HTTP中的GET, POST, PUT, DELETE就對應着對這個資源的查，改，增，刪4個操做。咱們最多見的就是GET和POST了。GET通常用於獲取/查詢資源信息，而POST通常用於更新資源信息.

咱們看看GET和POST的區別

GET提交的數據會放在URL以後，POST方法是把提交的數據放在HTTP包的Body中.在客戶端，Get方式在經過URL提交數據，參數在請求行裏面，數據在URL中能夠看到；POST方式，數據在請求體裏面，數據放置在HTML HEADER內提交。
GET提交的數據大小有限制（由於瀏覽器對URL的長度有限制，通常爲1024字節注意HTTP協議沒有對傳輸的數據大小進行限制，HTTP協議規範也沒有對URL長度進行限制，可是具體的瀏覽器有），而POST方法提交的數據沒有限制.
GET方式須要使用Request.QueryString來取得變量的值，而POST方式經過Request.Form來獲取變量的值。
GET方式提交數據，會帶來安全問題，好比一個登陸頁面，經過GET方式提交數據時，用戶名和密碼將出如今URL上，若是頁面能夠被緩存或者其餘人能夠訪問這臺機器，就能夠從歷史記錄得到該用戶的帳號和密碼.
get是從服務器上獲取數據，post是向服務器傳送數據。