request和response的中文亂碼問題

request亂碼指的是:瀏覽器向服務器發送的請求參數中包含中文字符,服務器獲取到的請求參數的值是亂碼;

response亂碼指的是:服務器向瀏覽器發送的數據包含中文字符,瀏覽器中顯示的是亂碼;html

亂碼產生的緣由:無論是request亂碼仍是response亂碼,其實都是因爲客戶端(瀏覽器)跟服務器端採用的編碼格式不一致形成的。java

以request亂碼爲例:瀏覽器向服務器發送請求,由於瀏覽器與服務器之間的通訊實質上是socket流,因此要先將請求參數(字符)轉換成字節,也就是編碼過程,服務器接收到請求參數後進行解碼(字節轉字符),而後封裝到request對象中。若是客戶端的編碼與服務器端的解碼不統一,就會致使經過request獲取到的請求參數的值是亂碼。web

 

解決亂碼:瀏覽器

1、response亂碼tomcat

    服務器發給瀏覽器的數據默認是按照ISO-8859-1編碼,瀏覽器接收到數據後按照默認的字符集進行解碼後顯示,若是瀏覽器的默認解碼字符集不是ISO-8859-1,就出現亂碼。服務器

    對於response亂碼,只須要在服務器端指定一個編碼字符集,而後通知瀏覽器按照這個字符集進行解碼就能夠了。有三種方式:socket

    一、response.setCharacterEncoding("utf-8」);//設置服務器端的編碼,默認是ISO-8859-1;該方法必須在response.getWriter()以前進行設置jsp

          response.setHeader("contentType", "text/html; charset=utf-8」);//通知瀏覽器服務器發送的數據格式是text/html,並要求瀏覽器使用utf-8進行解碼。post

    二、response.setContentType("text/html;charset=utf-8」);//等同於response.setHeader("contentType", "text/html; charset=utf-8」);它其實會覆蓋response.setCharacterEncoding("utf-8」) ,在開發中只須要設置response.setContentType("text/html;charset=utf-8」)就能夠了。意思是通知瀏覽器服務器發送的數據格式是text/html,服務器採用utf-8編碼,並要求瀏覽器使用utf-8進行解碼。ui

    三、response.setCharacterEncoding("utf-8」);//設置服務器端的編碼爲utf-8

          response.getWriter().println("<meta http-equiv='Content-Type' content='text/html; charset=utf-8'>」);//要求瀏覽器使用utf-8進行解碼

    能夠看出,第二種方式是最簡便的,這也是咱們在開發中最常使用的方式。

2、request亂碼

    從瀏覽器發起的訪問方式有三種:在地址欄直接輸入URL訪問、點擊頁面中的超連接訪問、提交表單訪問。第一種訪問方式瀏覽器默認將參數按照utf-8進行編碼,後面兩種訪問方式瀏覽器將參數按照當前頁面的顯示編碼進行編碼。因此對於request亂碼,只須要在服務器端設置相應的解碼格式便可。因爲訪問方式不一樣,瀏覽器對參數的編碼格式也不一樣,爲了方便處理,經過超連接和表單的訪問也規定必須是utf-8格式,即顯示當前頁面的編碼也要使用utf-8,這樣瀏覽器將統一使用utf-8對參數進行編碼。

    在服務器端,經過request.setCharacterEncoding("utf-8」)便可設置服務器的解碼爲utf-8(默認是ISO-8859-1),可是它只對請求體裏面的參數有效;若是參數跟在請求行中的uri後邊,它就無能爲力了。所以請求方式不一樣,解決亂碼的方案也不一樣。

    一、post方式

          post方式屬於表單提交,參數存在於請求體中,經過request.setCharacterEncoding("utf-8」)便可解決亂碼。

    二、get方式

          get方式提交的參數會跟在請求行中的uri後邊,服務器按照默認的iso-8859-1進行解碼,這時候解決亂碼有兩種辦法:

          辦法一:修改服務器端對uri參數的默認編碼

                 在tomcat的server.xml中,設置<Connector ….>元素的屬性URIEncoding="UTF-8」便可。(默認沒有設置此屬性)

                 例如:<Connector connectionTimeout="20000" port="8080" protocol="HTTP/1.1" redirectPort="8443" URIEncoding="UTF-8」/>

          注意:一、設置<Connector ….>元素的屬性useBodyEncodingForURI=「true」,意思是請求體和uri使用相同的編碼格式。經過設置這兩個屬性,既能夠解決get方式的亂碼,又能夠解決post方式的亂碼。二、經過修改server.xml指定服務器對get和post統一按照utf-8解碼,要求tomcat管理下的全部web應用都要使用utf-8編碼,即全部的jsp、html頁面都使用utf-8編碼。好比JSP頁面的頭信息是這樣的:

<%@ page language="java" contentType="text/html; charset=utf-8"

    pageEncoding="utf-8"%>

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"]]>

<html]]>

<head]]>

<meta http-equiv="Content-Type" content="text/html; charset=utf-8"]]>

<title]]>Insert title here</title]]>

</head]]>

           辦法二:逆向操做

           參數從瀏覽器到服務器,通過客戶端utf-8編碼,服務器端iso-8859-1解碼,最終成爲亂碼。那咱們將亂碼進行相反的編解碼,便可獲得正常的參數值。例如:String name = request.getParameter("name」);//獲得亂碼    name = new String(name.getBytes("iso-8859-1"),"utf-8」);//獲得正常的name值     注意:name.getBytes();若是不指定編碼,默認按照gb2312進行編碼。

相關文章
相關標籤/搜索