JavaWeb處理GET、POST時的編碼亂碼問題

對於GET方法,只要設置了res.setContentType("text/html;charset=UTF-8"), req.getParameter()就不會產生亂碼。html

對於POST方法,req.getQueryString()會返回null, req.getParameter()會產生亂碼java

須要用new String(req.getParameter("e").getBytes("iso-8859-1"), "utf-8")來獲得正確的編碼。瀏覽器

測試代碼以下:tomcat

out.println("req.getParameter(\"e\"):"+req.getParameter("e")+"</br>");
out.println("req.getParameter(\"e\"):"+new String(req.getParameter("e").getBytes("iso-8859-1"), "utf-8")+"</br>");
out.println("java.net.URLEncoder.encode(\"叫苦不迭二胎\", \"utf-8\"):"+"</br>"+java.net.URLEncoder.encode("叫苦不迭二胎", "utf-8")+"</br>");
byte[] bs = req.getParameter("e").getBytes("iso-8859-1");
for (byte b: bs) {
   out.print("%"+Integer.toHexString(0x000000ff&b).toUpperCase());
}
out.println("</br>");

  

瀏覽器顯示結果:post

 根據測試

java.net.URLEncoder.encode("叫苦不迭二胎", "utf-8")

 的輸出結果編碼

%E5%8F%AB%E8%8B%A6%E8%BF%9E%E5%A4%A9%E4%BA%8C%E8%83%8E

spa

java.net.URLDecoder.decode("%E5%8F%AB%E8%8B%A6%E8%BF%9E%E5%A4%A9%E4%BA%8C%E8%83%8E", "iso-8859-1")

的輸出結果.net

叫苦连天二胎

對比能夠看到,瀏覽器發送get、post請求時根據網頁設定的編碼將字符轉化問網頁的編碼用%分隔,在本例中是UTF-8編碼每一個字節用一個%分隔。3d

例如, 叫苦不迭二胎 的編碼的 E58FABE88BA6E8BF9EE5A4A9E4BA8CE8838E ,每一個字節前面加上一個%就變成了

%E5%8F%AB%E8%8B%A6%E8%BF%9E%E5%A4%A9%E4%BA%8C%E8%83%8E

而tomcat收到GET請求時,直接用req.getParameter("e")時內部會使用 java.net.URLDecoder.decode("%E5%8F%AB%E8%8B%A6%E8%BF%9E%E5%A4%A9%E4%BA%8C%E8%83%8E", "utf-8") 會得到正確的字符 叫苦不迭二胎 。

對於POST請求,直接用req.getParameter("e")會獲得亂碼 å«è‹¦è¿žå¤©äºŒèƒŽ ,由於tomcat內部會使用 java.net.URLDecoder.decode("%E5%8F%AB%E8%8B%A6%E8%BF%9E%E5%A4%A9%E4%BA%8C%E8%83%8E", "iso-8859-1") 從而獲得錯誤的 å«è‹¦è¿žå¤©äºŒèƒŽ 。此時我也應該使用先使用 java.net.URLEncoder.encode(req.getParameter("e"),"iso-8859-1") 把 å«è‹¦è¿žå¤©äºŒèƒŽ 還原成 %E5%8F%AB%E8%8B%A6%E8%BF%9E%E5%A4%A9%E4%BA%8C%E8%83%8E 而後再使用 java.net.URLDecoder.decode("%E5%8F%AB%E8%8B%A6%E8%BF%9E%E5%A4%A9%E4%BA%8C%E8%83%8E", "utf-8") 解碼便可獲得正確的字符 叫苦不迭二胎 ,代碼以下:

java.net.URLDecoder.decode(java.net.URLEncoder.encode(req.getParameter("e"),"iso-8859-1"), "utf-8")

 

便可獲得正確的結果。 以下圖:

相關文章
相關標籤/搜索