最近看了一些同窗的面經,發現不管什麼技術崗位,仍是會問到 get 和 post 的區別,而搜索出來的答案並不能讓咱們裝得一手好逼,那就讓咱們從 HTTP 報文的角度來擼一波,從而搞明白他們的區別。php
在開擼以前嗎,讓咱們先看一下標準答案長什麼樣子 w3school: GET 對比 POST。標準答案很美好,可是在面試的時候把下面的表格甩面試官一臉,估計會裝逼不成反被*。html
分類 | GET | POST |
---|---|---|
後退按鈕/刷新 | 無害 | 數據會被從新提交(瀏覽器應該告知用戶數據會被從新提交)。 |
書籤 | 可收藏爲書籤 | 不可收藏爲書籤 |
緩存 | 能被緩存 | 不能緩存 |
編碼類型 | application/x-www-form-urlencoded | application/x-www-form-urlencoded 或 multipart/form-data。爲二進制數據使用多重編碼。 |
歷史 | 參數保留在瀏覽器歷史中。 | 參數不會保存在瀏覽器歷史中。 |
對數據長度的限制 | 是的。當發送數據時,GET 方法向 URL 添加數據;URL 的長度是受限制的(URL 的最大長度是 2048 個字符)。 | 無限制。 |
對數據類型的限制 | 只容許 ASCII 字符。 | 沒有限制。也容許二進制數據。 |
安全性 | 與 POST 相比,GET 的安全性較差,由於所發送的數據是 URL 的一部分。在發送密碼或其餘敏感信息時毫不要使用 GET ! | POST 比 GET 更安全,由於參數不會被保存在瀏覽器歷史或 web 服務器日誌中。 |
可見性 | 數據在 URL 中對全部人都是可見的。 | 數據不會顯示在 URL 中。 |
注意,並非說標準答案有誤,上述區別在大部分瀏覽器上是存在的,由於這些瀏覽器實現了 HTTP 標準。python
因此從標準上來看,GET 和 POST 的區別以下:web
可是,既然本文從報文角度來講,那就先不討論 RFC 上的區別,單純從數據角度談談。面試
先下結論,GET 和 POST 方法沒有實質區別,只是報文格式不一樣。shell
GET 和 POST 只是 HTTP 協議中兩種請求方式,而 HTTP 協議是基於 TCP/IP 的應用層協議,不管 GET 仍是 POST,用的都是同一個傳輸層協議,因此在傳輸上,沒有區別。瀏覽器
報文格式上,不帶參數時,最大區別就是第一行方法名不一樣緩存
POST方法請求報文第一行是這樣的 POST /uri HTTP/1.1 \r\n
安全
GET方法請求報文第一行是這樣的 GET /uri HTTP/1.1 \r\n
服務器
是的,不帶參數時他們的區別就僅僅是報文的前幾個字符不一樣而已
帶參數時報文的區別呢? 在約定中,GET 方法的參數應該放在 url 中,POST 方法參數應該放在 body 中
舉個例子,若是參數是 name=qiming.c, age=22。
GET 方法簡約版報文是這樣的
GET /index.php?name=qiming.c&age=22 HTTP/1.1 Host: localhost
POST 方法簡約版報文是這樣的
POST /index.php HTTP/1.1 Host: localhost Content-Type: application/x-www-form-urlencoded name=qiming.c&age=22
如今咱們知道了兩種方法本質上是 TCP 鏈接,沒有差異,也就是說,若是我不按規範來也是能夠的。咱們能夠在 URL 上寫參數,而後方法使用 POST;也能夠在 Body 寫參數,而後方法使用 GET。固然,這須要服務端支持。
在約定中,咱們的參數是寫在 ?
後面,用 &
分割。
咱們知道,解析報文的過程是經過獲取 TCP 數據,用正則等工具從數據中獲取 Header 和 Body,從而提取參數。
也就是說,咱們能夠本身約定參數的寫法,只要服務端可以解釋出來就行,一種比較流行的寫法是 http://www.example.com/user/name/chengqm/age/22
。
按照網上大部分文章的解釋,POST 比 GET 安全,由於數據在地址欄上不可見。
然而,從傳輸的角度來講,他們都是不安全的,由於 HTTP 在網絡上是明文傳輸的,只要在網絡節點上捉包,就能完整地獲取數據報文。
要想安全傳輸,就只有加密,也就是 HTTPS。
在網上看到不少關於二者區別的文章都有這一條,提到瀏覽器地址欄輸入的參數是有限的。
首先說明一點,HTTP 協議沒有 Body 和 URL 的長度限制,對 URL 限制的大可能是瀏覽器和服務器的緣由。
瀏覽器緣由就不說了,服務器是由於處理長 URL 要消耗比較多的資源,爲了性能和安全(防止惡意構造長 URL 來攻擊)考慮,會給 URL 長度加限制。
有些文章中提到,post 會將 header 和 body 分開發送,先發送 header,服務端返回 100 狀態碼再發送 body。
HTTP 協議中沒有明確說明 POST 會產生兩個 TCP 數據包,並且實際測試(Chrome)發現,header 和 body 不會分開發送。
因此,header 和 body 分開發送是部分瀏覽器或框架的請求方法,不屬於 post 必然行爲。
若是對 get 和 post 報文區別有疑惑,直接起一個 Socket 服務端,而後封裝簡單的 HTTP 處理方法,直接觀察和處理 HTTP 報文,就能一目瞭然
#!/usr/bin/env python # -*- coding: utf-8 -*- import socket HOST, PORT = '', 23333 def server_run(): listen_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM) listen_socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1) listen_socket.bind((HOST, PORT)) listen_socket.listen(1) print('Serving HTTP on port %s ...' % PORT) while True: # 接受鏈接 client_connection, client_address = listen_socket.accept() handle_request(client_connection) def handle_request(client_connection): # 獲取請求報文 request = '' while True: recv_data = client_connection.recv(2400) recv_data = recv_data.decode() request += recv_data if len(recv_data) < 2400: break # 解析首行 first_line_array = request.split('\r\n')[0].split(' ') # 分離 header 和 body space_line_index = request.index('\r\n\r\n') header = request[0: space_line_index] body = request[space_line_index + 4:] # 打印請求報文 print(request) # 返回報文 http_response = b"""\ HTTP/1.1 200 OK <!DOCTYPE html> <html> <head> <title>Hello, World!</title> </head> <body> <p style="color: green">Hello, World!</p> </body> </html> """ client_connection.sendall(http_response) client_connection.close() if __name__ == '__main__': server_run()
上面代碼就是簡單的打印請求報文而後返回 HelloWorld 的 html 頁面,咱們運行起來
[root@chengqm shell]# python httpserver.py Serving HTTP on port 23333 ...
而後從瀏覽器中請求看看
打印出來的報文
而後就能夠手動證實上述說法,好比說要測試 header 和 body 是否分開傳輸,因爲代碼沒有返回 100 狀態碼,若是咱們 post 請求成功就說明是一塊兒傳輸的(Chrome/postman)。
又好比 w3school 裏面說 URL 的最大長度是 2048 個字符,那咱們在代碼裏面加上一句計算 uri 長度的代碼
... # 解析首行 first_line_array = request.split('\r\n')[0].split(' ') print('uri長度: %s' % len(first_line_array[1])) ...
咱們用 postman 直接發送超過 2048 個字符的請求看看
而後咱們能夠得出結論,url 長度限制是某些瀏覽器和服務器的限制,和 HTTP 協議沒有關係。
到此,咱們能夠愉快地裝逼了 :)
參考: