request、response 中文亂碼問題與解決方式

request亂碼指的是:瀏覽器向服務器發送的請求參數中包含中文字符,服務器獲取到的請求參數的值是亂碼;
 
response亂碼指的是:服務器向瀏覽器發送的數據包含中文字符,瀏覽器中顯示的是亂碼;
 
亂碼產生的緣由:無論是request亂碼仍是response亂碼,其實都是因爲客戶端(瀏覽器)跟服務器端採用的編碼格式不一致形成的。以request亂碼爲例:瀏覽器向服務器發送請求,由於瀏覽器與服務器之間的通訊實質上是socket流,因此要先將請求參數(字符)轉換成字節,也就是編碼過程,服務器接收到請求參數後進行解碼(字節轉字符),而後封裝到request對象中。若是客戶端的編碼與服務器端的解碼不統一,就會致使經過request獲取到的請求參數的值是亂碼。
 
解決:
1、response亂碼
服務器發給瀏覽器的數據默認是按照ISO-8859-1編碼,瀏覽器接收到數據後按照默認的字符集進行解碼後顯示,若是瀏覽器的默認解碼字符集不是ISO-8859-1,就出現亂碼。
    對於response亂碼,只須要在服務器端指定一個編碼字符集,而後通知瀏覽器按照這個字符集進行解碼就能夠了。有三種方式:
    一、A、設置服務器端的編碼
   response.setCharacterEncoding("utf-8」);
   默認是ISO-8859-1;該方法必須在response.getWriter()以前進行設置
   B、通知瀏覽器服務器發送的數據格式
         response.setHeader("Content-type", "text/html; charset=utf-8」);
    二、A、通知瀏覽器服務器發送的數據格式
     response.setContentType("text/html;charset=utf-8」);
   等同於response.setHeader("contentType", "text/html; charset=utf-8」);它其實會覆蓋response.setCharacterEncoding("utf-8」) ,在開發中只須要設
   B、設置服務器端的編碼
   response.setContentType("text/html;charset=utf-8」);
    三、A、設置服務器端的編碼
   response.setCharacterEncoding("utf-8」);
   B、瀏覽器使用utf-8進行解碼
         
總結:設置:
A、設置服務器端的編碼
response.setCharacterEncoding("utf-8」);
B、通知瀏覽器服務器發送的數據格式
response.setContentType("text/html;charset=utf-8」);
C、瀏覽器使用utf-8進行解碼
         
本人就是這樣設置的,以防萬一;
2、request亂碼
從瀏覽器發起的訪問方式有三種:在地址欄直接輸入URL訪問、點擊頁面中的超連接訪問、提交表單訪問。第一種訪問方式瀏覽器默認將參數按照utf-8進行編碼,後面兩種訪問方式瀏覽器將參數按照當前頁面的顯示編碼進行編碼。因此對於request亂碼,只須要在服務器端設置相應的解碼格式便可。因爲訪問方式不一樣,瀏覽器對參數的編碼格式也不一樣,爲了方便處理,經過超連接和表單的訪問也規定必須是utf-8格式,即顯示當前頁面的編碼也要使用utf-8,這樣瀏覽器將統一使用utf-8對參數進行編碼。
A、post方式
post方式屬於表單提交,參數存在於請求體中。
request.setCharacterEncoding("utf-8」)
B、get方式
get方式提交的參數會跟在請求行中的uri後邊,服務器按照默認的iso-8859-1進行解碼,這時候解決亂碼有兩種辦法:
修改服務器端對uri參數的默認編碼
在tomcat的server.xml中,設置元素的屬性URIEncoding="UTF-8」便可。(默認沒有設置此屬性)
例如:注意:一、設置元素的屬性useBodyEncodingForURI=「true」,意思是請求體和uri使用相同的編碼格式。經過設置這兩個屬性,既能夠解決get方式的亂碼,又能夠解決     post方式的亂碼。二、經過修改server.xml指定服務器對get和post統一按照utf-8解碼,要求tomcat管理下的全部web應用都要使用utf-8編碼,即全部的jsp、html頁面都使用utf-8編碼。
 

首先,response返回有兩種,一種是字節流outputstream,一種是字符流printwrite。html

申明:這裏爲了方便起見,全部輸出都統一用UTF-8編碼。web

先說字節流,要輸出「中國",給輸出流的必須是轉換爲utf-8的「中國」,還要告訴瀏覽器,用utf8來解析數據瀏覽器

 

       //這句話的意思,是讓瀏覽器用utf8來解析返回的數據
        response.setHeader("Content-type", "text/html;charset=UTF-8");
        String data = "中國";
        OutputStream ps = response.getOutputStream();
        //這句話的意思,使得放入流的數據是utf8格式
        ps.write(data.getBytes("UTF-8"));



 

再說字符流,要輸出中國,須要設置response.setCharacterEncoding("UTF-8");tomcat

 

               //這句話的意思,是讓瀏覽器用utf8來解析返回的數據
		response.setHeader("Content-type", "text/html;charset=UTF-8");
		//這句話的意思,是告訴servlet用UTF-8轉碼,而不是用默認的ISO8859
		response.setCharacterEncoding("UTF-8");
		String data = "中國";
		PrintWriter pw = response.getWriter();
		pw.write(data);

 

 

經驗:1,若是中文返回出現??字符,這代表沒有加response.setCharacterEncoding("UTF-8");這句話。服務器

            2,若是返回的中文是「烇湫」這種亂碼,說明瀏覽器的解析問題,應該檢查下是否忘加response.setHeader("Content-type", "text/html;charset=UTF-8");這句話。socket

相關文章
相關標籤/搜索