背景 html
今兒個一新來的應屆生問我,開發模式中所看到的web請求的請求頭裏的屬性怎麼理解,我便根據本身的經驗隨便拉開一個請求跟他聊了起來,順便本身記錄下文字版,之後再有交流直接發地址給他就行了,嘻嘻,機智!nginx
題外話:web
1、構成HTTP請求的簡單流程圖(圖摘錄的),以下:apache
Web Client能夠是瀏覽器、搜索引擎、機器人等等一切基於HTTP協議發起http請求的工具。Web Server能夠是任何的能解析HTTP請求,並返回給Web Client可識別的響應的服務,常見的有apache、nginx、IIS等等web服務器。瀏覽器
2、客戶端跟服務的交互(這圖也是摘錄的,哈哈)緩存
要看圖還不明白中過程的話,那就更通俗的理解爲:服務器
URL
,並按下回車鍵DNS
服務器請求解析該URL
中的域名對應的IP
地址(若是是IP
請求,則不須要該步驟)IP
後,根據IP
和端口號,和服務器創建TCP鏈接TCP
三次握手的第三個報文發送給服務器TCP
鏈接
從中就能夠延伸出如下要說的內容了。也就是交互直接的報文,這裏就簡單說說其中請求報文跟響應報文,主要也是方便新手簡單瞭解下,具體的底層仍是得本身去查閱資料網絡
內容工具
HTTP鏈接中報文分爲請求(request)和響應(response)兩種。每種報文在HTTP首部都有不一樣的字段來標識不一樣的用途。post
1. 請求報文:HTTP協議使用TCP協議進行傳輸,在應用層協議發起交互以前,首先是TCP的三次握手。完成了TCP三次握手後,客戶端會向服務器發出一個請求報文
請求頭由key/value對組成,每行爲一對,key和value之間經過冒號(:)分割。請求頭的做用主要用於通知服務端有關於客戶端的請求信息
HTTP最多見的請求頭以下:
Accept:瀏覽器可接受的MIME類型;
Accept-Charset:瀏覽器可接受的字符集;
Accept-Encoding:瀏覽器可以進行解碼的數據編碼方式,好比gzip。Servlet可以向支持gzip的瀏覽器返回經gzip編碼的HTML頁面。許多情形下這能夠減小5到10倍的下載時間;
Accept-Language:瀏覽器所但願的語言種類,當服務器可以提供一種以上的語言版本時要用到;
Authorization:受權信息,一般出如今對服務器發送的WWW-Authenticate頭的應答中;
Connection:表示是否須要持久鏈接。若是Servlet看到這裏的值爲「Keep-Alive」,或者看到請求使用的是HTTP 1.1(HTTP 1.1默認進行持久鏈接),它就能夠利用持久鏈接的優勢,當頁面包含多個元素時(例如Applet,圖片),顯著地減小下載所須要的時間。要實現這一點,Servlet須要在應答中發送一個Content-Length頭,最簡單的實現方法是:先把內容寫入ByteArrayOutputStream,而後在正式寫出內容以前計算它的大小;
Content-Length:表示請求消息正文的長度;
Cookie:這是最重要的請求頭信息之一;
From:請求發送者的email地址,由一些特殊的Web客戶程序使用,瀏覽器不會用到它;
Host:初始URL中的主機和端口;
If-Modified-Since:只有當所請求的內容在指定的日期以後又通過修改才返回它,不然返回304「Not Modified」應答;
Pragma:指定「no-cache」值表示服務器必須返回一個刷新後的文檔,即便它是代理服務器並且已經有了頁面的本地拷貝;
Referer:包含一個URL,用戶從該URL表明的頁面出發訪問當前請求的頁面。
User-Agent:瀏覽器類型,若是Servlet返回的內容與瀏覽器類型有關則該值很是有用;
UA-Pixels,UA-Color,UA-OS,UA-CPU:由某些版本的IE瀏覽器所發送的非標準的請求頭,表示屏幕大小、顏色深度、操做系統和CPU類型。
2. 響應報文:當收到get或post等方法發來的請求後,服務器就要對報文進行響應。
常見的響應頭,以下:
Allow:服務器支持哪些請求方法(如GET、POST等);
Content-Encoding:文檔的編碼(Encode)方法。只有在解碼以後才能夠獲得Content-Type頭指定的內容類型。利用gzip壓縮文檔可以顯著地減小HTML文檔的下載時間。Java的GZIPOutputStream能夠很方便地進行gzip壓縮,但只有Unix上的Netscape和Windows上的IE 四、IE 5才支持它。所以,Servlet應該經過查看Accept-Encoding頭(即request.getHeader("Accept-Encoding"))檢查瀏覽器是否支持gzip,爲支持gzip的瀏覽器返回經gzip壓縮的HTML頁面,爲其餘瀏覽器返回普通頁面;
Content-Length:表示內容長度。只有當瀏覽器使用持久HTTP鏈接時才須要這個數據。若是你想要利用持久鏈接的優點,能夠把輸出文檔寫入ByteArrayOutputStram,完成後查看其大小,而後把該值放入Content-Length頭,最後經過byteArrayStream.writeTo(response.getOutputStream()發送內容;
Content-Type: 表示後面的文檔屬於什麼MIME類型。Servlet默認爲text/plain,但一般須要顯式地指定爲text/html。因爲常常要設置Content-Type,所以HttpServletResponse提供了一個專用的方法setContentTyep。 可在web.xml文件中配置擴展名和MIME類型的對應關係;
Date:當前的GMT時間。你能夠用setDateHeader來設置這個頭以免轉換時間格式的麻煩;
Expires:指明應該在何時認爲文檔已通過期,從而再也不緩存它。
Last-Modified:文檔的最後改動時間。客戶能夠經過If-Modified-Since請求頭提供一個日期,該請求將被視爲一個條件GET,只有改動時間遲於指定時間的文檔纔會返回,不然返回一個304(Not Modified)狀態。Last-Modified也可用setDateHeader方法來設置;
Location:表示客戶應當到哪裏去提取文檔。Location一般不是直接設置的,而是經過HttpServletResponse的sendRedirect方法,該方法同時設置狀態代碼爲302;
Refresh:表示瀏覽器應該在多少時間以後刷新文檔,以秒計。除了刷新當前文檔以外,你還能夠經過setHeader("Refresh", "5; URL=http://host/path")讓瀏覽器讀取指定的頁面。注意這種功能一般是經過設置HTML頁面HEAD區的<META HTTP-EQUIV="Refresh" CONTENT="5;URL=http://host/path">實現,這是由於,自動刷新或重定向對於那些不能使用CGI或Servlet的HTML編寫者十分重要。可是,對於Servlet來講,直接設置Refresh頭更加方便。注意Refresh的意義是「N秒以後刷新本頁面或訪問指定頁面」,而不是「每隔N秒刷新本頁面或訪問指定頁面」。所以,連續刷新要求每次都發送一個Refresh頭,而發送204狀態代碼則能夠阻止瀏覽器繼續刷新,不論是使用Refresh頭仍是<META HTTP-EQUIV="Refresh" ...>。注意Refresh頭不屬於HTTP 1.1正式規範的一部分,而是一個擴展,但Netscape和IE都支持它。
到這裏對於新手來講就大概明瞭吧也還能夠延伸看看另外一篇http://www.javashuo.com/article/p-derhpskk-gw.html,若是還有興趣就能夠去了解下文件傳輸協議FTP、電子郵件傳輸協議SMTP、域名系統服務DNS、網絡新聞傳輸協議NNTP和HTTP協議等,並理解下代理(Proxy)、網關(Gateway)和通道(Tunnel)也都是較基礎的內容的,好吧,繼續加油撒!