JSP和Servlet的中文亂碼處理

  本文轉自:http://blog.csdn.net/longyuhome/article/details/7856270

JSP和Servlet的中文亂碼處理 前幾天學習了JSP和Servlet中有關中文亂碼的一些問題,寫成了博客,今天進行更新一下。應該是能夠解決平常的亂碼問題了。如今做如下總結但願對須要的人有所幫助。我也是剛學,因此有不足之處但願諒解。 1、表單提交時出現亂碼: 在進行表單提交的時候,常常提交一些中文,天然就避免不了出現中文亂碼的狀況,對於表單來講有兩種提交方式:get和post提交方式。因此請求的時候便有get請求和post請求。之前我一直覺得get請求和post請求方式出現的亂碼的解決方式是同樣的,可是今天才知道兩種請求方式所產生的亂碼的解決方式是不一樣的。每種方式都有着不一樣的解決方法,之因此出現亂碼,緣由就在於get請求時,其傳遞給服務器的數據是附加在URL地址以後的;而post的請求時,其傳遞給服務器的數據是做爲請求體的一部分傳遞給服務器。這也就致使了對它們所產生的亂碼的處理方式是不一樣的。
1、客戶端的get請求 對於不一樣的請求方式,解決亂碼的問題也是不同的,對於客戶端的get請求來講,服務器端處理要想不出現亂碼,解決這個問題稍微複雜一些,須要用到String類型的構造函數,其中的一個構造函數就是用指定的編碼方式去解碼,通常都用「UTF-8」的方式。只要在服務器端將請求獲得的參數從新構形成一個字符串就好了。以下所示: String stuname = request.getParameter("stuname"); String str = new String(stuname.getBytes("ISO-8859-1"),"utf-8") 通過構造以後,客戶端輸入中文,且表單時get請求的狀況下,str就變成了中文了。若是請求參數比較多,最好將它封裝成一個工具類: public class MyUtil { public static String getNewString(String str) throws UnsupportedEncodingException { return new String(str.getBytes("ISO-8859-1"),"UTF-8"); } } String stuname= MyUtil.getNewString(request.getParameter("stuname")); 2、客戶端的post請求 對於客戶端的post請求來講,處理亂碼的問題就比較簡單了,由於請求的數據時做爲請求體的一部分傳遞給服務器的,因此只要修改請求內的編碼就好了。只要在服務器端的最開始處將請求的數據設置爲「UTF-8」就好了,輸入以下語句: request. setCharacterEncoding(「UTF-8」); 這樣用戶在服務器端獲取到的中文數據就再也不是亂碼了。 2、超連接時出現亂碼(低版本瀏覽器不行IE6) 在Web開發中,挺多的時候都是經過超連接去傳遞中文參數的,這也會致使在顯示的時候也會出現亂碼,對於超連接來講,它其實是向服務器端發送了一個請求,而它發出的請求是屬於get請求,因此對於超連接的亂碼來講,它處理亂碼的方式和表單的get請求出現亂碼的方式是同樣的。 String stuname= MyUtil.getNewString(request.getParameter("stuname")); 3、重定向時出現亂碼(低版本瀏覽器不行IE6) 有時寫上response的sendRedirect()方法進行重定向時也會出現亂碼,重定向時實際上也是向服務器發送了一個請求,因此解決亂碼的方法和和上面是同樣的。 4、瀏覽器版本低致使的亂碼 上網的時候,有時提交的一些信息在地址欄顯示的是「%2C%C6%CC%C6」的字樣,其實這都是防止出現亂碼進行的解決方案,若是你的瀏覽器是IE6或如下版本,則咱們的第二種狀況和第三種狀況會出現亂碼(尤爲是當中文是奇數的時候),這就很差使了因此咱們必須採用另外一種比較實際的做法: 在java.net包中提供了URLEncoder類和URLDcoder類,這兩個類又分別提供了encode和decode兩個靜態方法,分別用於進行編碼和解碼。咱們將要傳遞的中文參數進行編碼以後,在傳遞給服務器,服務器解碼以後,就能夠顯示中文了。 進行編碼:URLEncoder.encode(stuname,」UTF-8」) 傳遞給服務器:<a href=」/1.jsp?stuname<%=stuname%>」>傳遞</a> 進行解碼:URLDecoder.decode(stuname,」UTF-8」); 這樣就能夠獲得傳遞過來的中文參數了,我發現許多網站用的都是這種方式解決中參數的。 5、返回瀏覽器顯示的亂碼 在Servlet編程中,常常須要經過response對象將一些信息返回給瀏覽器,給咱們的客戶端,而咱們在服務器端顯示的中文,可是響應給客戶端瀏覽器倒是亂碼,這主要是因爲response對象的getWriter()方法返回的PrintWriter對象默認使用「ISO-8859-1」字符集編碼進行Unicode字符串到字節數組的轉換,因爲ISO8859-1字符集中根本就沒有包含中文字符,因此Java在進行轉換的時候會將無效的字符編碼輸出給客戶端,因而便出現了亂碼,爲此ServletResponse接口中便定義了setCharacterEncoding、setContentType等方法來指定getWriter方法返回的PrintWriter對象所使用的字符集編碼,因此咱們在寫Servlet程序中,在調用getWriter方法以前設置這些方法的值。咱們爲了防止亂碼,常常將如下兩條語句一塊兒寫上: response.setContentType(「text/html;charset=utf-8」); response. setCharacterEncoding(「UTF-8」); 只要編寫Servlet文件中含有響應給客戶端的信息,那麼就要寫上這兩句話。最好寫上第二句話,由於它的優先級高,它的設置結果將覆蓋setContentType等方法設置的字符編碼集。 6、修改Tomcat的編碼 在上述的get請求所致使亂碼問題中,還有一種解決的方案,咱們經常使用Tomcat做爲運行Servlet和JSP的容器,而Tomcat內部默認的編碼是ISO-8859-1,因此對於get請求方式,其傳遞的數據(URI)會附加在訪問的資源後面,其編碼是Tomcat默認的,若是修改該URI的編碼,那麼對於全部的get請求方式便不會出現亂碼了包括上邊說的重定向和超連接,在Tomcat的配置文件server.xml中找到修改Tomcat的端口的地方,在其內部加入URIEncoding屬性,設置爲和你的項目中所設的編碼同樣的值,這裏所有都是UTF-8。以下所示: <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000"redirectPort="8443" URIEncoding="UTF-8" /> 7、使用MySQL數據庫亂碼 有時會用JDBC鏈接MySQL數據庫,可能會出現亂碼,因此要在鏈接以後加上以下的語句: useUnicode=true&characterEncoding=UTF-8 這樣就能夠解決亂碼問題了。 在編寫Servlet和JSP的時候,爲了不出現亂碼,最重要的就是:採用一致的編碼,若是編碼都一致了,確定不會出現亂碼。若是出現了亂碼確定那個地方不一致了。
相關文章
相關標籤/搜索