java web 一次請求編碼設置的過程

簡單的認爲:pageEncoding是jsp文件自己的編碼;contentType的charset是指服務器發送給客戶端時的內容編碼。例如:pageEncoding="GBK"。這句話的意思是,告訴JVM 這個jsp自己採用的"GBK"編碼,在JSP編譯成Servlet傳給JVM的時候,就用「GBK」的編碼方式將Jsp網頁源文件翻譯成統一的UTF-8形式的Java字節碼。若是不加設定,則JVM默認的用ISO-8859-1這種編碼方式。contentType裏的charset=gbk,指的是此網頁文件輸出到瀏覽器的輸出方式爲gbk。在這個過程當中,一個JSP的源文件須要通過三個階段,兩次編碼,才能完成一次完整的輸出。第一階段:將jsp編譯成Servlet(.java)文件。用到的指令是pageEncoding,根據pageEncoding=「XXX」的指示,找到編碼的規則爲「XXX」,服務器在將JSP文件編譯成.java文件時會根據pageEncoding的設定讀取jsp,結果是由指定的編碼方案翻譯成統一的UTF-8編碼的JAVA源碼(即.java)。
第二階段:從Servlet文件(.java)到Java字節碼文件(.class),從UTF-8到UTF-8。在這一階段中,不論JSP編寫時候用的是什麼編碼方案,通過這個階段的結果所有是UTF-8的encoding的java源碼。JAVAC用UTF-8的encoding讀取java源碼,編譯成UTF-8編碼的二進制碼(即.class),這是JVM對常數字串在二進制碼(java encoding)內表達的規範。這一過程是由JVM的內在規範決定的,不受外界控制。
第三階段:從服務器到瀏覽器,這在一過程當中用到的指令是contentType。服務器載入和執行由第二階段生成出來JAVA二進制碼,輸出的結果,也就是在客戶端可見到的結果,在此次輸出過程當中,由contentType屬性中的charset來指定,將UTF8形式的二進制碼以charset的編碼形式來輸出。若是沒有人爲設定,則默認的是ISO-8859-1的形式。html

 

一、pageEncoding="UTF-8"的做用是設置JSP編譯成Servlet時使用的編碼。 
二、contentType="text/html;charset=UTF-8"的做用是指定對服務器響應進行從新編碼的編碼。 
三、request.setCharacterEncoding("UTF-8")的做用是設置對客戶端請求進行從新編碼的編碼。
四、response.setCharacterEncoding("UTF-8")的做用是指定對服務器響應進行從新編碼的編碼。 
response.setCharacterEncoding("UTF-8")的做用是指定對服務器響應進行從新編碼的編碼。同時,瀏覽器也是根據這個參數來對其接收到的數據進行從新編碼(或者稱爲解碼)。因此在不管你在JSP中設置response.setCharacterEncoding ("UTF-8")或者response.setCharacterEncoding("GBK"),瀏覽器均能正確顯示中文(前提是你發送到瀏覽器的數據編碼是正確的,好比正確設置了pageEncoding參數等)。java

 

對於發送數據,服務器按照response.setCharacterEncoding—contentType—pageEncoding的優先順序,對要發送的數據進行編碼。 

對於接收數據,要分三種狀況。一種是瀏覽器直接用URL提交的數據,另外兩種是用表單的GET和POST方式提交的數據。瀏覽器

 

對於表單中POST方式提交的數據,只要在接收數據的JSP中正確request.setCharacterEncoding參數,即將對客戶端請求進行從新編碼的編碼設置成瀏覽器編碼,就能夠保證獲得的參數編碼正確。有寫讀者可能會問,那如何獲得瀏覽器編碼呢?上面咱們提過了,在默認請狀況下,瀏覽器編碼就是你在響應該請求的JSP頁面中response.setCharacterEncoding設置的值。因此對於POST表單提交的數據,在得到數據的JSP頁面中request.setCharacterEncoding要和生成提交該表單的JSP頁面的 response.setCharacterEncoding設置成相同的值。 

對於URL提交的數據和表單中GET方式提交的數據,在接收數據的JSP中設置request.setCharacterEncoding參數是不行的,由於在Tomcat5.0中,默認狀況下使用ISO- 8859-1對URL提交的數據和表單中GET方式提交的數據進行從新編碼(解碼),而不使用該參數對URL提交的數據和表單中GET方式提交的數據進行從新編碼(解碼)。要解決該問題,應該在Tomcat的配置文件的Connector標籤中設置useBodyEncodingForURI或者 URIEncoding屬性,其中useBodyEncodingForURI參數表示是否用request.setCharacterEncoding 參數對URL提交的數據和表單中GET方式提交的數據進行從新編碼,在默認狀況下,該參數爲false(Tomcat4.0中該參數默認爲true); URIEncoding參數指定對全部GET方式請求(包括URL提交的數據和表單中GET方式提交的數據)進行統一的從新編碼(解碼)的編碼。 URIEncoding和useBodyEncodingForURI區別是,URIEncoding是對全部GET方式的請求的數據進行統一的從新編碼(解碼),而useBodyEncodingForURI則是根據響應該請求的頁面的request.setCharacterEncoding參數對數據進行的從新編碼(解碼),不一樣的頁面能夠有不一樣的從新編碼(解碼)的編碼。因此對於URL提交的數據和表單中GET方式提交的數據,能夠修改 URIEncoding參數爲瀏覽器編碼或者修改useBodyEncodingForURI爲true,而且在得到數據的JSP頁面中 request.setCharacterEncoding參數設置成瀏覽器編碼。服務器

相關文章
相關標籤/搜索