jsp經過include指令引入html亂碼的解決方法

在jsp中使用<%@include file="in.html" %>導入html頁面時,若是html頁面裏有中文,就會產生亂碼。檢查jsp文件和html文件的編碼,編碼一致,都是統一使用的utf-8,檢查生成的Servlet類文件,發現裏面直接就亂碼了。html

jsp頁面內容:java

<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%>  
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">  
<html>  
<head>  
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">  
<title>測試JSP的include指令</title>  
</head>  
<body>  
<%@include file="in.html" %><br/>  
<%@include file="in1.jsp"%><br/>  
<%@include file="in2.html" %>  
</body>  
</html>  


in.html文件內容:web

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">  
<html>  
<head>  
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">  
<title></title>  
</head>  
<body>  
我是in.html文件的內容  
</body>  
</html>  

 

生成的Servlet內容:apache

out.write("<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\" \"http://www.w3.org/TR/html4/loose.dtd\">\r\n");  
out.write("<html>\r\n");  
out.write("<head>\r\n");  
out.write("<meta http-equiv=\"Content-Type\" content=\"text/html; charset=UTF-8\">\r\n");  
out.write("<title></title>\r\n");  
out.write("</head>\r\n");  
out.write("<body>\r\n");  
out.write("我是in.html文件的内容\r\n");  
out.write("</body>\r\n");  
out.write("</html>\r\n");  

 

經過上面生成的Servlet內容能夠看出,在將jsp文件編譯成java類這一過程就出現了亂碼,問題確定是編碼一致的,而設置編碼的有兩個:pageEncoding和contentType,這兩個屬性的區別以下:tomcat

pageEncoding是jsp文件自己的編碼,是指定web容器將jsp編譯成java文件時採用什麼編碼讀取jsp文件。服務器

contentType的charset設置的編碼是指服務器發送給客戶端時的內容編碼。app

而客戶端訪問一個jsp文件要通過以下三個階段:jsp

一、(第一次訪問時)web容器將jsp編譯成java文件,這個階段編譯器會根據pageEncoding設置的編碼讀取jsp文件,翻譯成統一的utf-8的Servlet類,若是pageEncoding設置錯誤或未設置,編譯出來的java文件就會出現中文亂碼。測試

二、由javac將java源碼編譯成class字節碼,javac用utf-8編碼讀取java源碼,編譯成utf-8編碼的二進制文件。ui

三、web容器載入class字節碼文件,將內容輸出結果到客戶端,這一過程內容的編碼爲contentType設置的編碼。

因而可知,是因爲pageEncoding設置問題致使翻譯jsp時亂碼。有兩種方式處理:

方法一:在每一個引入的html文件設置pageEncoding編碼,即在html添加<%@page pageEncoding="UTF-8"%>,儘管html不能識別該指令,但經過include指令引入時該指令就能起做用了,以下:

<%@page pageEncoding="UTF-8"%>  
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">  
<html>  
<head>  
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">  
<title></title>  
</head>  
<body>  
我是in.html文件的內容  
</body>  
</html>  

方法二:在web.xml裏統一配置pageEncoding的編碼,在web-app標籤裏添加以下配置:

採用<%@ include file=""%>方式包含文件時,須要在被包含文件裏指定其pageEncoding.

不然沒法獲取到對應的pageEncoding,則tomcat採用iso8850-1來讀取被包含文件,被包含文件含有中文時就會出現亂碼。但若是include的是一個html,txt等靜態文件就比較麻煩。如今測試出一個方案就是在web.xml裏添加:

<jsp-config>
   <jsp-property-group>   
       <display-name>JSPConfiguration</display-name>   
       <url-pattern>*.html</url-pattern>   
       <page-encoding>UTF-8</page-encoding>   
    </jsp-property-group>
</jsp-config>

就能夠了。指定以html結尾的文件都以utf-8編碼去讀取。

<jsp-config>  
    <jsp-property-group>  
        <description>html encoding</description>  
        <display-name>JSPConfiguration</display-name>  
        <url-pattern>*.html</url-pattern>  
        <el-ignored>true</el-ignored>  
        <page-encoding>UTF-8</page-encoding>  
        <scripting-invalid>false</scripting-invalid>  
        <include-prelude></include-prelude>  
        <include-coda></include-coda>  
    </jsp-property-group>  
</jsp-config>  


方法一和方法二原理是同樣的,都是經過設置pageEncoding編碼來指定jsp將html文件include時使用的編碼。方法一和方法二任選一種便可,若是同時使用須要注意兩個地方設置的pageEncoding編碼必須一致,不然將會報以下編碼不一致的錯誤:

org.apache.jasper.JasperException: /in.html (line: 1, column: 2) Page-encoding specified in jsp-property-group (UTF-8) is different from that specified in page directive (GBK)  
相關文章
相關標籤/搜索