淺析HTTP代理原理--轉

代理服務器是HTTP協議中一個重要的組件,發揮着重要的做用。 關於HTTP代理的文章有不少,本文再也不贅述,若是不清楚的能夠看一下 HTTP代理的基礎知識html

本文主要介紹代理的事例,分析一個真實的案例來幫助理解HTTP代理的原理。python

HTTP代理的原理

下面分析一個 http://iflow.uczzd.cn/iflow/api/v1/client_event?app=uc-iflow...通過代理服務器的HTTP請求。 iflow.uczzd.cn的公網IP是140.205.136.82(各地測試到的IP有可能不一樣),個人局域網IP是192.168.100.115,代理服務器的IP是192.168.16.35web

再簡單說一下HTTP請求的流程: 192.168.100.115140.205.136.82發送HTTP請求,其中192.168.16.35是代理服務器。api

1、 監控請求

經過網絡監控獲取到的HTTP請求以下:服務器

網絡監控HTTP請求

能夠看到在網絡監控中,有兩個HTTP請求,一個是向代理服務器發送的HTTP,另外一個是代理服務器想目標服務器發送的HTTP請求。這兩個請求的請求體是同樣的,以下圖:網絡

客戶端向代理服務器發送的HTTP報文:app

發向Proxy服務器

代理服務器想目標服務器發送的HTTP報文:測試

發向目標服務器

2、 推測處理流程

能夠看到,兩張圖片的HTTP報文是相同的(也有可能Header不一樣),咱們能夠推測出客戶端和代理服務器的處理流程,以下:spa

客戶端的處理流程:代理

客戶端的處理流程

代理服務器的處理流程:

代理服務器的處理流程

3、 驗證推測的處理流程

在推測出客戶端和代理服務器的處理邏輯後,咱們須要驗證咱們的推測是否正確。

咱們能夠構造一個TCP請求,客戶端鏈接到代理服務器,發送HTTP報文,報文的內容是客戶端直接發送到服務器的內容。

例如:直接訪問 http://www.cnblogs.com/tgwang/的HTTP報文是:

GET http://www.cnblogs.com/tgwang/ HTTP/1.1 Host: www.cnblogs.com Connection: close Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8 Upgrade-Insecure-Requests: 1 User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.111 Safari/537.36 Referer: http://www.cnblogs.com/ Accept-Encoding: gzip, deflate, sdch Accept-Language: zh-CN,zh;q=0.8 Cookie: *** If-Modified-Since: Sat, 30 Jan 2016 02:48:23 GMT

咱們構造一個TCP請求,鏈接代理服務器,報文的內容也是發送上面的報文,看代理服務器可否正常請求博客園的數據,若是能夠正常請求,說明咱們對於客戶端和代理服務器推測是正確的,若是沒有請求博客園數據,而是返回代理服務器的相關信息,表示推測錯誤。

下面我使用python向代理服務器127.0.0.1:8888發送一個TCP請求,爲了在代理服務器中能找到此請求,我在Header中增長了一個Token,使用UUID標識(見紅框)。

Python發送HTTP請求

運行程序,發送TCP請求,報文以下:

proxy請求報文

查看代理服務器的信息,可知,HTTP請求正常發送到博客園,而且正常響應,以下圖:

代理服務器監控

到此推測驗證完成,符合預期結果

書本上的理論看多了,就覺得本身看懂了,然而咱們真的懂了嗎?沒動手實踐過能算是懂了嗎

 

轉:https://www.cnblogs.com/tgwang/p/5170480.html

相關文章
相關標籤/搜索