Python Web學習筆記之WebSocket 通訊過程與實現

 

1、什麼是 WebSocket ?

 

WebSocket 是一種標準協議,用於在客戶端和服務端之間進行雙向數據傳輸。但它跟 HTTP 沒什麼關係,它是基於 TCP 的一種獨立實現。html

之前客戶端想知道服務端的處理進度,要不停地使用 Ajax 進行輪詢,讓瀏覽器隔個幾秒就向服務器發一次請求,這對服務器壓力較大。另一種輪詢就是採用 long poll 的方式,這就跟打電話差很少,沒收到消息就一直不掛電話,也就是說,客戶端發起鏈接後,若是沒消息,就一直不返回 Response 給客戶端,鏈接階段一直是阻塞的。前端

而 WebSocket 解決了 HTTP 的這幾個難題。當服務器完成協議升級後( HTTP -> WebSocket ),服務端能夠主動推送信息給客戶端,解決了輪詢形成的同步延遲問題。因爲 WebSocket 只須要一次 HTTP 握手,服務端就能一直與客戶端保持通訊,直到關閉鏈接,這樣就解決了服務器須要反覆解析 HTTP 協議,減小了資源的開銷。python

 

隨着新標準的推動,WebSocket 已經比較成熟了,而且各個主流瀏覽器對 WebSocket 的支持狀況比較好(不兼容低版本 IE,IE 10 如下),有空能夠看看。web

使用 WebSocket 的時候,前端使用是比較規範的,js 支持 ws 協議,感受相似於一個輕度封裝的 Socket 協議,只是之前須要本身維護 Socket 的鏈接,如今可以以比較標準的方法來進行。算法

下面咱們就結合上圖具體來聊一下 WebSocket 的通訊過程。segmentfault

 

2、創建鏈接

 

1. 客戶端請求報文 Header

客戶端請求報文瀏覽器

 

與傳統 HTTP 報文不一樣的地方:緩存

 

這兩行表示發起的是 WebSocket 協議。安全

Sec-WebSocket-Key 是由瀏覽器隨機生成的,提供基本的防禦,防止惡意或者無心的鏈接。服務器

Sec-WebSocket-Version 表示 WebSocket 的版本,最初 WebSocket 協議太多,不一樣廠商都有本身的協議版本,不過如今已經定下來了。若是服務端不支持該版本,須要返回一個 Sec-WebSocket-Versionheader,裏面包含服務端支持的版本號。

建立 WebSocket 對象:

 

ws 表示使用 WebSocket 協議,後面接地址及端口

完整的客戶端代碼:

 

2. 服務端響應報文 Header

首先咱們來看看服務端的響應報文:

咱們一行行來解釋:

  1. 首先,101 狀態碼錶示服務器已經理解了客戶端的請求,並將經過 Upgrade 消息頭通知客戶端採用不一樣的協議來完成這個請求;

  2. 而後, Sec-WebSocket-Accept 這個則是通過服務器確認,而且加密事後的 Sec-WebSocket-Key;

  3. 最後, Sec-WebSocket-Protocol 則是表示最終使用的協議。

Sec-WebSocket-Accept 的計算方法:

  1. 將 Sec-WebSocket-Key 跟 258EAFA5-E914-47DA-95CA-C5AB0DC85B11 拼接;

  2. 經過 SHA1 計算出摘要,並轉成 base64 字符串。

注意: Sec-WebSocket-Key/ Sec-WebSocket-Accept 的換算,只能帶來基本的保障,但鏈接是否安全、數據是否安全、客戶端 / 服務端是否合法的 ws 客戶端、ws 服務端,其實並無實際性的保證。

建立主線程,用於實現接受 WebSocket 創建請求:

 

 

3. 進行通訊

a. 服務端解析 WebSocket 報文

Server 端接收到 Client 發來的報文須要進行解析

Client 包格式

 

1.FIN: 佔 1bit

  • 0:不是消息的最後一個分片

  • 1:是消息的最後一個分片

2.RSV1, RSV2, RSV3:各佔 1bit

通常狀況下全爲 0。當客戶端、服務端協商採用 WebSocket 擴展時,這三個標誌位能夠非 0,且值的含義由擴展進行定義。若是出現非零的值,且並無採用 WebSocket 擴展,鏈接出錯。

3.Opcode: 4bit

  • %x0:表示一個延續幀。當 Opcode 爲 0 時,表示本次數據傳輸採用了數據分片,當前收到的數據幀爲其中一個數據分片;

  • %x1:表示這是一個文本幀(text frame);

  • %x2:表示這是一個二進制幀(binary frame);

  • %x3-7:保留的操做代碼,用於後續定義的非控制幀;

  • %x8:表示鏈接斷開;

  • %x9:表示這是一個心跳請求(ping);

  • %xA:表示這是一個心跳響應(pong);

  • %xB-F:保留的操做代碼,用於後續定義的控制幀。

4.Mask: 1bit

表示是否要對數據載荷進行掩碼異或操做。

  • 0:否

  • 1:是

5.Payload length: 7bit or (7 + 16)bit or (7 + 64)bit

表示數據載荷的長度。

  • 0~126:數據的長度等於該值;

  • 126:後續 2 個字節表明一個 16 位的無符號整數,該無符號整數的值爲數據的長度;

  • 127:後續 8 個字節表明一個 64 位的無符號整數(最高位爲 0),該無符號整數的值爲數據的長度。

6.Masking-key: 0 or 4bytes

  • 當 Mask 爲 1,則攜帶了 4 字節的 Masking-key;

  • 當 Mask 爲 0,則沒有 Masking-key。

  • 掩碼算法:按位作循環異或運算,先對該位的索引取模來得到 Masking-key 中對應的值 x,而後對該位與 x 作異或,從而獲得真實的 byte 數據。

注意:掩碼的做用並非爲了防止數據泄密,而是爲了防止早期版本的協議中存在的代理緩存污染攻擊(proxy cache poisoning attacks)等問題。

7.Payload Data: 載荷數據

 

解析 WebSocket 報文代碼以下:

 

 

b. 服務端發送 WebSocket 報文

返回時不攜帶掩碼,因此 Mask 位爲 0,再按載荷數據的大小寫入長度,最後寫入載荷數據。

struct 模塊解析

 

按照給定的格式 fmt,把數據封裝成字符串 ( 其實是相似於 C 結構體的字節流 )

struct 中支持的格式以下表:

爲了同 C 語言中的結構體交換數據,還要考慮有的 C 或 C++ 編譯器使用了字節對齊,一般是以 4 個字節爲單位的 32 位系統,故而 struct 根據本地機器字節順序轉換。能夠用格式中的第一個字符來改變對齊方式,定義以下:

 

發送 WebSocket 報文代碼以下

 

 

3、總結

沒有其餘能像 WebSocket 同樣實現全雙工傳輸的技術了,迄今爲止,大部分開發者仍是使用 Ajax 輪詢來實現,但這是個不太優雅的解決辦法,WebSocket 雖然用的人很少,多是由於協議剛出來的時候有安全性的問題以及兼容的瀏覽器比較少,但如今都有解決。若是你有這些需求能夠考慮使用 WebSocket:

  1. 多個用戶之間進行交互;

  2. 須要頻繁地向服務端請求更新數據。

好比彈幕、消息訂閱、多玩家遊戲、協同編輯、股票基金實時報價、視頻會議、在線教育等須要高實時的場景。

參考文章

  • https://www.zhihu.com/question/20215561/answer/40316953

  • http://fullstackpython.atjiang.com/websockets.html

  • http://www.52im.net/thread-1341-1-1.html

 

參考

相關文章
相關標籤/搜索