python之路-----前端之http協議

一.概述html

  HTTPhypertext transport protocol),即超文本傳輸協議。這個協議詳細規定了瀏覽器和萬維網服務器之間互相通訊的規則(B/S架構)。web

  HTTP就是一個基於TCP的通訊規則,規定了客戶端發送給服務器的內容格式,也規定了服務器發送給客戶端的內容格式。傳輸過程使用了TCP協議。其實咱們要學習的就是這個兩個格式!客戶端發送給服務器的格式叫請求協議;服務器發送給客戶端的格式叫響應協議瀏覽器

  特色:緩存

  • HTTP叫超文本傳輸協議,基於請求/響應模式的!服務器

  • HTTP是無狀態協議。架構

  URL:統一資源定位符,就是一個網址:協議名://域名:端口/路徑,例如:http://www.oldboy.cn:80/index.html併發

  URI:,統一資源標識符,用來表示文件在服務器上面的位置,有多是絕對位置,也能夠是相對位置。經過是主機域名後的那部分爲URI。app

    HTTP無狀態:無狀態是指協議對於事務處理沒有記憶能力,服務器不知道客戶端是什麼狀態。從另外一方面講,打開一個服務器上的網頁和你以前打開這個服務器上的網頁之間沒有任何聯繫。
    若是你要實現一個購物車,須要藉助於Cookie或Session或服務器端API(如NSAPI and ISAPI)記錄這些信息,請求服務器結算頁面時同時將這些信息提交到服務器。
    當你登陸到一個網站時,你的登陸狀態也是由Cookie或Session來「記憶」的,由於服務器並不知道你是否登陸。

優勢:服務器不用爲每一個客戶端鏈接分配內存來記憶大量狀態,也不用在客戶端失去鏈接時去清理內存,以更高效地去處理WEB業務
缺點:客戶端的每次請求都須要攜帶相應參數,服務器須要處理這些參數

容易犯的誤區:
1、HTTP是一個無狀態的面向鏈接的協議,無狀態不表明HTTP不能保持TCP鏈接,更不能表明HTTP使用的是UDP協議(無鏈接)
二、從HTTP/1.1起,默認都開啓了Keep-Alive,保持鏈接特性,簡單地說,當一個網頁打開完成後,客戶端和服務器之間用於傳輸
HTTP數據的TCP鏈接不會關閉,若是客戶端再次訪問這個服務器上的網頁,會繼續使用這一條已經創建的鏈接
三、Keep-Alive不會永久保持鏈接,它有一個保持時間,能夠在不一樣的服務器軟件(如Apache)中設定這個時間.當這段時間內瀏覽器不在發送數據時,服務器纔會斷開鏈接
如何理解無狀態協議
什麼是URL?
    URL是統一資源定位器(Uniform Resource Locator)的縮寫,也被稱爲網頁地址,是因特網上標準的資源的地址。
URL舉例
    http://www.sohu.com/stu/intro.html
    http://222.172.123.33/stu/intro.html

URL地址由4部分組成
    第1部分:爲協議:http://、ftp://等 
    第2部分:爲站點地址:能夠是域名或IP地址
    第3部分:爲頁面在站點中的目錄:stu
    第4部分:爲頁面名稱,例如 index.html
    各部分之間用「/」符號隔開。
url詳解

二.請求協議jsp

  請求協議的格式以下:ide

請求首行;  // 請求方式 請求路徑 協議和版本,例如:GET /index.html HTTP/1.1
請求頭信息;// 請求頭名稱:請求頭內容,即爲key:value格式,例如:Host:localhost
空行;     // 用來與請求體分隔開
請求體。   // GET沒有請求體,只有POST有請求體。get提交數據,數據內容會體如今url中

  瀏覽器發送給服務器的內容就這個格式的,若是不是這個格式服務器將沒法解讀。在HTTP協議中,請求有不少請求方法,其中最爲經常使用的就是GETPOST。不一樣的請求方法之間的區別,後面會一點一點的介紹。

 

  2.1 GET請求

  HTTP默認的請求方法就是GET

  get請求常見場景:

       * 沒有請求體
       * 數據大小有限(瀏覽器地址欄有限)
       * GET請求數據會暴露在瀏覽器的地址欄中(http://test.com/index.html?username=root&pwd=123)

  GET請求經常使用的操做:
         1. 在瀏覽器的地址欄中直接給出URL,那麼就必定是GET請求
         2. 點擊頁面上的超連接也必定是GET請求
         3. 提交表單時,表單默認使用GET請求,但能夠設置爲POST

            Host: 127.0.0.1:8080
            Connection: keep-alive
            User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) Chrome/60.0.3112.113 Safari/537.36   用戶端信息,包括瀏覽器,系統新等
            Accept: image/webp,image/apng,image/*,*/*;q=0.8  #瀏覽器能夠渲染的文件類型
            Referer: http://127.0.0.1:8080/
            Accept-Encoding: gzip, deflate, br    #接受的編碼,也能夠協商gbk等
            Accept-Language: zh-CN,zh;q=0.8         #可接受的語言
       
Connection: keep-alive客戶端支持的連接方式,保持一段時間連接,默認爲3000ms
       
Cookie: JSESSIONID=369766FDF6220F7803433C0B2DE36D98由於不是第一次訪問這個地址,因此會在請求中把上一次服務器響應中發送過來的Cookie在請求中一併發送去過;這個Cookie的名字爲JSESSIONID。

  2.2 POST請求

  post請求特色:

    (1). 數據不會出如今地址欄中
    (2). 數據的大小沒有上限
    (3). 有請求體
    (4). 請求體中若是存在中文,會使用URL編碼(解決數據中帶有特殊符號的問題,功能相似於轉義)。

咱們都知道Http協議中參數的傳輸是"key=value"這種簡直對形式的,若是要傳多個參數就須要用「&」符號對鍵值對進行分割。如"?name1=value1&name2=value2",這樣在服務端在收到這種字符串的時候,會用「&」分割出每個參數,而後再用「=」來分割出參數值。

 

針對「name1=value1&name2=value2」咱們來講一下客戶端到服務端的概念上解析過程: 
  上述字符串在計算機中用ASCII嗎表示爲: 
  6E616D6531 3D 76616C756531 26 6E616D6532 3D 76616C756532。 
   6E616D6531:name1 
   3D:= 
   76616C756531:value1 
   26:&
   6E616D6532:name2 
   3D:= 
   76616C756532:value2 
   服務端在接收到該數據後就能夠遍歷該字節流,首先一個字節一個字節的吃,當吃到3D這字節後,服務端就知道前面吃得字節表示一個key,再想後吃,若是遇到26,說明從剛纔吃的3D到26子節之間的是上一個key的value,以此類推就能夠解析出客戶端傳過來的參數。

   如今有這樣一個問題,若是個人蔘數值中就包含=或&這種特殊字符的時候該怎麼辦。 
好比說「name1=value1」,其中value1的值是「va&lu=e1」字符串,那麼實際在傳輸過程當中就會變成這樣「name1=va&lu=e1」。咱們的本意是就只有一個鍵值對,可是服務端會解析成兩個鍵值對,這樣就產生了奇異。

如何解決上述問題帶來的歧義呢?解決的辦法就是對參數進行URL編碼 
   URL編碼只是簡單的在特殊字符的各個字節前加上%,例如,咱們對上述會產生奇異的字符進行URL編碼後結果:「name1=va%26lu%3D」,這樣服務端會把緊跟在「%」後的字節當成普通的字節,就是不會把它當成各個參數或鍵值對的分隔符。
爲何要使用url編碼

  post方式請求頭:

Request Headers
Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Accept-Encoding:gzip, deflate
Accept-Language:zh-CN,zh;q=0.8
Cache-Control:no-cache
Connection:keep-alive
Content-Length:13
Content-Type:application/x-www-form-urlencoded
Cookie:csrftoken=z5H43ZwARx7AIJ82OEizBOWbsAQA2LPk
Host:127.0.0.1:8090
Origin:http://127.0.0.1:8090
Pragma:no-cache
Referer:http://127.0.0.1:8090/login/
Upgrade-Insecure-Requests:1
User-Agent:Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_1) 
           AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.89 Safari/537.36

#請求體
Form Data username:yuan    

  POST請求是能夠有體的,而GET請求不能有請求體。

  • Referer: http://localhost:8080/hello/index.jsp請求來自哪一個頁面,例如你在百度上點擊連接到了這裏,那麼Referer:http://www.baidu.com;若是你是在瀏覽器的地址欄中直接輸入的地址,那麼就沒有Referer這個請求頭了;
  • Content-Type: application/x-www-form-urlencoded表單的數據類型,說明會使用url格式編碼數據;url編碼的數據都是以「%」爲前綴,後面跟隨兩位的16進制。
  • Content-Length:13請求體的長度,這裏表示13個字節。
  • keyword=hello請求體內容!hello是在表單中輸入的數據,keyword是表單字段的名字。
    Referer請求頭是比較有用的一個請求頭,它能夠用來作統計工做,也能夠用來作防盜鏈。
    統計工做:我公司網站在百度上作了廣告,但不知道在百度上作廣告對咱們網站的訪問量是否有影響,那麼能夠對每一個請求中的Referer進行分析,若是Referer爲百度的不少,那麼說明用戶都是經過百度找到咱們公司網站的。
    防盜鏈:我公司網站上有一個下載連接,而其餘網站盜鏈了這個地址,例如在我網站上的index.html頁面中有一個連接,點擊便可下載JDK7.0,但有某我的的微博中盜鏈了這個資源,它也有一個連接指向咱們網站的JDK7.0,也就是說登陸它的微博,點擊連接就能夠從我網站上下載JDK7.0,這致使咱們網站的廣告沒有看,但下載的倒是我網站的資源。這時可使用Referer進行防盜鏈,在資源被下載以前,咱們對Referer進行判斷,若是請求來自本網站,那麼容許下載,若是非本網站,先跳轉到本網站看廣告,而後再容許下載。
    referer介紹

     

三.響應協議

  3.1 響應內容

  響應協議的格式以下:

響應首行;  # HTTP/1.1
響應頭信息; 空行; 響應體。  

  響應內容是由服務器發送給瀏覽器的內容,瀏覽器會根據響應內容來顯示。遇到<img src=''>會開一個新的線程加載,因此有時圖片多的話,內容會先顯示出來,而後圖片才一張張加載出來。

Request URL:http://127.0.0.1:8090/login/    #請求的url
Request Method:GET  #請求的方式
Status Code:200 OK  #響應的狀態碼
Remote Address:127.0.0.1:8090  #連接的地址
Response Headers
view source
Content-Type:text/html; charset=utf-8
Date:Wed, 26 Oct 2016 06:48:50 GMT  #日期
Server:WSGIServer
/0.2 CPython/3.5.2 #服務器信息
X-Frame-Options:SAMEORIGIN <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Title</title> </head> <body> <form action="/login/" method="post"> 用戶名:<input type="text" name="username"/> <input type="submit" value="提交"/> </form> </body> </html>   

響應頭詳解:

  • HTTP/1.1 200 OK:響應協議爲HTTP1.1,狀態碼爲200,表示請求成功,OK是對狀態碼的解釋;
  • cache-control:max-age=30 緩存控制
  • content-encoding:gzip 內容編碼
  • content-length:29318 內容長度,不包括頭部
  • content-type:text/html; charset=utf-8 內容類型
  • date:Wed, 30 Aug 2017 13:36:14 GMT 響應的時間,這可能會有8小時的時區差;
  • expires:Wed, 30 Aug 2017 13:36:04 GMT 過時時間
  • server:JDWS/2.0 服務器信息
  • Set-Cookie: JSESSIONID=C97E2B4C55553EAB46079A4F263435A4; Path=/hello:響應給客戶端的Cookie;

  3.2 狀態碼

  響應頭對瀏覽器來講很重要,它說明了響應的真正含義。例如200表示響應成功了,302表示重定向,這說明瀏覽器須要再發一個新的請求

  2xx 響應成功
  4xx  客戶端問題
  5xx 服務端問題
  302  重定向
  304  緩存驗證經過
 (具體狀態碼內容能夠自行百度)
  瀏覽器第一次到服務器請求,服務器會響應lats-modified給瀏覽器,瀏覽器會將文件緩存下來,若是你第二次請求,瀏覽器會帶着if-motify-since頭部到服務端驗證,若是文件依舊是新的,那麼服務端會響應304告訴瀏覽器緩存文件依舊是新的,可使用。若是緩存是舊的,那麼服務端會響應200,從新傳輸數據給瀏覽器。    
304詳解

  3.3其餘狀態碼  

  告訴瀏覽器不要緩存的響應頭:

  • Expires: -1
  • Cache-Control: no-cache
  • Pragma: no-cache

  自動刷新響應頭,瀏覽器會在3秒以後請求http://www.baidu.com

  • Refresh: 3;url=http://www.baidu.com 

  3.4 HTML中指定響應頭

  在HTMl頁面中可使用<meta http-equiv="" content="">來指定響應頭,例如在index.html頁面中給出<meta http-equiv="Refresh" content="3;url=http://www.baidu.com">,表示瀏覽器只會顯示index.html頁面3秒,而後自動跳轉到http://www.baidu.com.

相關文章
相關標籤/搜索