JSP中文亂碼問題

    

        JSP中文亂碼問題終極解決方案             

        分類:             Web前端              2012-03-31 10:00     10123人閱讀     評論(18)     收藏     舉報    

在介紹方法以前咱們首先應該清楚具體的問題有哪些,筆者在本博客當中論述的JSP中文亂碼問題有以下幾個方面:頁面亂碼、參數亂碼、表單亂碼、源文件亂碼。下面來逐一解決其中的亂碼問題。html

1、JSP頁面中文亂碼前端

在JSP頁面中,中文顯示亂碼有兩種狀況:一種是HTML中的中文亂碼,另外一種是在JSP中動態輸出的中文亂碼。java

先看一個JSP程序:編程

 

  1. <%@ page language="java" import="java.util.*"  %>  
  2. <html>  
  3.     <head>  
  4.     <title>中文顯示示例</title>  
  5.   
  6.     </head>   
  7.     <body>  
  8.     這是一箇中文顯示示例:  
  9.     <%  
  10.         String str = "中文";  
  11.         out.print(str);  
  12.     %>  
  13.     </body>  
  14. </html>  
<%@ page language="java" import="java.util.*"  %>
<html>
	<head>
	<title>中文顯示示例</title>

	</head> 
	<body>
	這是一箇中文顯示示例:
	<%
		String str = "中文";
		out.print(str);
  	%>
	</body>
</html>

 

上面這個JSP程序看起來好像是在頁面顯示幾句中文並且標題也是中文。運行後在瀏覽器中顯示如圖所示瀏覽器

 

緣由在於沒有在JSP中指定頁面顯示的編碼,消除亂碼的解決方案很簡單上面代碼中page命令修改爲以下所示便可服務器

 

  1. <%@ page language="java" import="java.util.*" contentType="text/html; charset=GB2312" %>  
  2. <html>  
  3.     <head>  
  4.     <title>中文顯示示例</title>  
  5.   
  6.     </head>   
  7.     <body>  
  8.     這是一箇中文顯示示例:  
  9.     <%  
  10.         String str = "中文";  
  11.         out.print(str);  
  12.     %>  
  13.     </body>  
  14. </html>  
<%@ page language="java" import="java.util.*" contentType="text/html; charset=GB2312" %>
<html>
	<head>
	<title>中文顯示示例</title>

	</head> 
	<body>
	這是一箇中文顯示示例:
	<%
		String str = "中文";
		out.print(str);
  	%>
	</body>
</html>

 

再次運行亂碼消失,原理就是向頁面指定編碼爲GB2312,那麼頁面就會按照此編碼來顯示,因而亂碼消失。eclipse

2、URL傳遞參數中文亂碼jsp

通常狀況下在使用get方法提交表單的時候傳遞的參數若是是中文的話極可能會出現亂碼。編輯器

下面是一個示例程序post

 

  1. <%@ page language="java" import="java.util.*" contentType="text/html;charset=gb2312"%>  
  2. <html>  
  3.     <head>   
  4.         <title>URL傳遞參數中文處理示例</title>  
  5.     </head>  
  6.     <%  
  7.         String param = request.getParameter("param");  
  8.     %>  
  9.     <body>  
  10.         <a href="URLCharset.jsp?param='中文'">請點擊這個連接</a><br>  
  11.         你提交的參數爲:<%=param%>  
  12.     </body>  
  13. </html>  
<%@ page language="java" import="java.util.*" contentType="text/html;charset=gb2312"%>
<html>
	<head> 
		<title>URL傳遞參數中文處理示例</title>
	</head>
	<%
		String param = request.getParameter("param");
	%>
	<body>
		<a href="URLCharset.jsp?param='中文'">請點擊這個連接</a><br>
		你提交的參數爲:<%=param%>
	</body>
</html>

 

上面這個JSP程序的功能就是經過一個URL連接向自身傳遞一個參數,這個參數是中文字符串,這個程序的運行效果以下圖

 

對於URL傳遞中文參數亂碼這個問題,其處理方法比較特殊,僅僅轉換這個中文字符串或者設置JSP頁面顯示編碼都是不能解決問題的,須要修改Tomcat服務器的配置文件才能解決問題。在這裏修改Tomcat的conf目錄下的server.xml配置文件,具體改後的代碼以下

 

  1. <Connector port="8080" protocol="HTTP/1.1" URIEncoding="gb2312"  
  2.                connectionTimeout="20000"    
  3.                redirectPort="8443" />  
<Connector port="8080" protocol="HTTP/1.1" URIEncoding="gb2312"
               connectionTimeout="20000"  
               redirectPort="8443" />

 

在原來代碼中添加URI編碼設置URIEncoding=「gb2312」便可,重啓Tomcat服務器能夠獲得正確的頁面。其原理也和上面的狀況相似,就是向程序指明編碼類型,而後顯示就正常了。

3、表單提交中文亂碼

對於表單的數據可使用request.getParameter(「」)的方法獲取,可是當表單中出現中文數據的時候就會出現亂碼。

示例代碼以下

 

  1. <%@ page language="java" import="java.util.*" contentType="text/html;charset=gb2312"%>  
  2. <html>  
  3.     <head>     
  4.         <title>Form中文處理示例</title>  
  5.     </head>   
  6.     <body>  
  7.         <font size="2">  
  8.                 下面是表單內容:  
  9.             <form action="AcceptFormCharset.jsp" method="post">  
  10.                 用戶名:<input type="text" name="userName" size="10"/>  
  11.                 密  碼:<input type="password" name="password" size="10"/>  
  12.                 <input type="submit" value="提交">  
  13.             </form>    
  14.         </font>  
  15.     </body>  
  16. </html>  
<%@ page language="java" import="java.util.*" contentType="text/html;charset=gb2312"%>
<html>
	<head>   
		<title>Form中文處理示例</title>
	</head> 
	<body>
		<font size="2">
				下面是表單內容:
			<form action="AcceptFormCharset.jsp" method="post">
				用戶名:<input type="text" name="userName" size="10"/>
				密  碼:<input type="password" name="password" size="10"/>
				<input type="submit" value="提交">
			</form>  
		</font>
	</body>
</html>

 

在上面的表單當中想AcceptFormCharset這個頁面提價兩項數據,下面是AcceptFormCharset.jsp的內容:

 

  1. <%@ page language="java" import="java.util.*"  
  2.     contentType="text/html;charset=gb2312"%>  
  3. <html>  
  4.     <head>  
  5.         <title>Form中文亂碼</title>  
  6.     </head>  
  7.     <body>  
  8.         <font size="2"> 下面是表單提交之後用request取到的表單數據:<br>  
  9.             <%  
  10.                 String userName = request.getParameter("userName");  
  11.                 String password = request.getParameter("password");  
  12.                 out.println("表單輸入userName的值:" + userName + "<br>");  
  13.                 out.println("表單輸入password的值:" + password + "<br>");  
  14.              %>   
  15.         </font>  
  16.     </body>  
  17. </html>  
<%@ page language="java" import="java.util.*"
	contentType="text/html;charset=gb2312"%>
<html>
	<head>
		<title>Form中文亂碼</title>
	</head>
	<body>
		<font size="2"> 下面是表單提交之後用request取到的表單數據:<br>
			<%
				String userName = request.getParameter("userName");
	 			String password = request.getParameter("password");
	 			out.println("表單輸入userName的值:" + userName + "<br>");
	 			out.println("表單輸入password的值:" + password + "<br>");
 			 %> 
 		</font>
	</body>
</html>

 

在上面的程序中,若是表單輸入沒有中文,則能夠正常的顯示當輸入的數據中有中文的時候,獲得的結果如圖所示。

 

產生種結果的緣由是Tomcat中對於post方法提交的表單採用的默認編碼爲ISO-8859-1,而這種編碼格式不支持中文字符。對於這個問題能夠採用轉換編碼格式的方法來解決,如今對AcceptFromCharset這個頁面改動以下:

 

  1. <%@ page language="java" import="java.util.*"  
  2.     contentType="text/html;charset=gb2312"%>  
  3. <html>  
  4.     <head>  
  5.         <title>Form中文亂碼</title>  
  6.     </head>  
  7.     <body>  
  8.         <font size="2"> 下面是表單提交之後用request取到的表單數據:<br>  
  9.             <%  
  10.                 String userName = request.getParameter("userName");  
  11.                 String password = request.getParameter("password");  
  12.                 out.println("表單輸入userName的值:" + new String(userName.getBytes("ISO-8859-1"), "gb2312")+ "<br>");  
  13.                 out.println("表單輸入password的值:" + new String(password.getBytes("ISO-8859-1"), "gb2312")+ "<br>");  
  14.              %>   
  15.         </font>  
  16.     </body>  
  17. </html>  
<%@ page language="java" import="java.util.*"
	contentType="text/html;charset=gb2312"%>
<html>
	<head>
		<title>Form中文亂碼</title>
	</head>
	<body>
		<font size="2"> 下面是表單提交之後用request取到的表單數據:<br>
			<%
				String userName = request.getParameter("userName");
	 			String password = request.getParameter("password");
	 			out.println("表單輸入userName的值:" + new String(userName.getBytes("ISO-8859-1"), "gb2312")+ "<br>");
	 		 	out.println("表單輸入password的值:" + new String(password.getBytes("ISO-8859-1"), "gb2312")+ "<br>");
 			 %> 
 		</font>
	</body>
</html>

 

通過這樣的轉換編碼之後,全部的中文輸入均可以用request對象正常取出。在上面這個程序中,第四行和第五行是轉換編碼格式的關鍵,先從ISO-8859-1格式的字符串中取出字節內容,而後在用GB2312的編碼格式從新構造一個新的字符串。這樣就能夠支持中文變淡輸入的正常取值和顯示。改進之後程序運行結果以下

 

通過上面的更改編碼格式的處理,表單的中文輸入亂碼問題已經獲得解決。可是若是上面的表單中的輸入項不止是兩個,那麼每一個輸入項都須要進行編碼轉換,那樣就很麻煩了。這是咱們就用到了大名鼎鼎的過濾器filter了。關於這裏的內容大體的思慮和上面的同樣具體作法請參照筆者的另外一篇文章

4、Eclipse中JSP文件中文亂碼

在Eclipse或者MyEclipse中因爲默認的JSP編碼格式爲ISO-8859-1,因此當打開由其餘編輯器編輯的JSP文件時會出現亂碼,如圖所示

 

對於這個問題咱們只須要更改一下Eclipse或者是MyEclipse中對JSP的默認編碼就能夠了,修改的地方(個人MyEclipse版本爲11)如圖所示

 

PS

在Eclipse或者MyEclipse當中JSP文件默認的編碼爲ISO-8859-1,因此在JSP代碼中間若是出現中文就不能保存,例如以下代碼

 

  1. <%@ page language="java" import="java.util.*" %>  
  2. <html>  
  3.     <head>  
  4.     <title>中文顯示示例</title>  
  5.   
  6.     </head>   
  7.     <body>  
  8.     這是一箇中文顯示示例:  
  9.     <%  
  10.         String str = "中文";  
  11.         out.print(str);  
  12.     %>  
  13.     </body>  
  14. </html>  
<%@ page language="java" import="java.util.*" %>
<html>
	<head>
	<title>中文顯示示例</title>

	</head> 
	<body>
	這是一箇中文顯示示例:
	<%
		String str = "中文";
		out.print(str);
  	%>
	</body>
</html>

 

修改後在保存的時候會提示以下:

 

現這個提示的緣由在於JSP源文件中有ISO=8859-1編碼沒法識別的中文字符,對於這個問題,解決辦法就是在JSP頁面中聲明頁面編碼格式便可。聲明後代碼以下:

 

  1. <%@ page language="java" import="java.util.*"  pageEncoding="GB2312" %>  
  2. <html>  
  3.     <head>  
  4.     <title>中文顯示示例</title>  
  5.   
  6.     </head>   
  7.     <body>  
  8.     這是一箇中文顯示示例:  
  9.     <%  
  10.         String str = "中文";  
  11.         out.print(str);  
  12.     %>  
  13.     </body>  
  14. </html>  
<%@ page language="java" import="java.util.*"  pageEncoding="GB2312" %>
<html>
	<head>
	<title>中文顯示示例</title>

	</head> 
	<body>
	這是一箇中文顯示示例:
	<%
		String str = "中文";
		out.print(str);
  	%>
	</body>
</html>

 

其中第一行中pageEncoding=「gb2312」指明瞭JSP頁面編碼採用GB2312,這樣就能夠正常保存JSP的源文件了。

 

遇到問題首先分析問題出現的緣由,只有知道了緣由才能去解決,學習分析問題的來源遠比解決這個問題重要的多。

亂碼問題的緣由就是程序(Eclipse也好,瀏覽器也罷)的編碼沒有和編程人員的編碼進行統一,(就像你和一個不懂中文的人用中文交流他固然不懂了)那麼解決這個問題只須要將編程人員想要的編碼告訴程序就能夠了,以上解決亂碼問題的種種方法均可以說是一種聲明編碼的過程,也就是說亂碼問題終極解決方案就是:轉碼。這裏的轉碼要麼是編程人員手動轉,要麼就是聲明一下讓程序去轉,換句話說就是:和不懂中文的交流,要麼讓他學中文,要麼你就去學習他的語言。

生活就是編程,編程就是生活,同之,通之!!!

相關文章
相關標籤/搜索