Java web應用中的常見字符編碼問題的解決方法

如下是 Java web應用的常見編碼問題 html

1. html頁面的編碼 java

在web應用中,一般瀏覽器會根據http header: Content-type的值來決定用什麼encoding, 好比遇到Content-Type: text/html; charset=UTF-8, 頁面使用的就UTF-8編碼。可是考慮到離線的html(用戶可能把頁面html保存到本地), 打開離線的html的時候就要在meta指定編碼,固然不指定也會有default值,那麼不指定有時就可能出現亂碼。 web

Meta標籤 瀏覽器

 
  1. <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/> 

2. Http Request的編碼 服務器

一般瀏覽在發送一個請求到服務器的時候,不會設置字符編碼,在服務器端爲了統一編碼,能夠在filter 中使用request.setCharacterEncoding("UTF-8")來設置編碼. 通常瀏覽器都是用默認的ISO-8859-1字符編碼,要解決中文參數亂碼的時候都必須這一步。 app

3. http response的編碼 jsp

http response中能夠設置輸出到瀏覽器的數據使用的編碼方法是response.setCharacterEncoding("UTF-8")和response.setContentType("text/html; charset=UTF-8"), 若是隻是單純的設置編碼,最好是用response.setCharacterEncoding("UTF-8"),由於response.setContentType("text/html; charset=UTF-8")是針對具體的MIME類型設置對應的字符編碼。須要注意的是這裏設置的編碼對JSP頁面不必定起做用,理由是JSP頁面有本身設置字符編碼的方式,並且優先級更高。 ui

4. JSP頁面的編碼 編碼

有如下三種方式, 若是同時有第一種和第二種的時候只有一種會生效(若是不一樣的話), url

還有第一種和第二種會覆蓋第三種

最後要注意的是在使用1)或2)聲明編碼類型時,若是頁面中include了其餘JSP, 對於<%@ include file="BB.jsp" %>和<jsp:include page="BB.jsp"/>的區別, 假設在AA.jsp中使用前一種方式includeBB.jsp,那麼BB.jsp中就不能有重複的編碼的聲明,效果是AA.jsp和BB.jsp都使用AA.jsp中聲明的編碼方式進行編碼。

若是是使用後一種include的方式的話,AA.jsp和BB.jsp中均可以有各自編碼的聲明。

1) <%@ page contentType="text/html;charset=UTF-8"%>

2) <%@ page pageEncoding ="charset=UTF-8"%>

3) 在web.xml中添加如下設置

 
  1. <jsp-config> 
  2.  
  3. <jsp-property-group> 
  4. <url-pattern>*.jsp</url-pattern> 
  5.  
  6. <page-encoding>UTF-8</page-encoding> 
  7. </jsp-property-group> 
  8.  
  9. </jsp-config> 

5. web.xml和weblogic.xml中的mime的設置

在web.xml中能夠指定mime映射,同時也能夠指定對應類型使用的字符編碼 (這裏的設置也可使用3中所說的http response.setContentType和response.setCharacterEncoding來作到),好比:

 
  1. <mime-mapping> 
  2.  
  3. <extension>html</extension> 
  4.  
  5. <mime-type>text/html; charset=UTF-8</mime-type> 
  6.  
  7. </mime-mapping> 
  8.  

在weblogic.xml中能夠設置默認的mime類型和字符編碼

 
  1. <container-discriptor> 
  2.  
  3. <default-mime-type>text/html; charset=UTF-8</default-mime-type> 
  4.  
  5. </container-discriptor> 

還有

 
  1. <charset-params> 
  2.  
  3. <input-charset> 
  4.  
  5. <resource-path>/*</resource-path> 
  6.  
  7. <java-charset-name>UTF-8</java-charset-name> 
  8.  
  9. </input-charset> 
  10.  
  11. </charset-params> 

總的來講,一個應用中html, http request, http response 和jsp pages中最好顯示地指定相同的字符編碼,最方便的就是都設爲UTF-8,全部字符都不會出錯。對於mime mapping的設置最好是在web.xml中設置。weblogic中的關於字符編碼的設置通常不用設置(若是你把前面所說的都設置正確之後)。

相關文章
相關標籤/搜索