1. HTTP消息頭html
(1)通用信息頭java
即能用於請求消息中,也能用於響應信息中,但與被傳輸的實體內容沒有關係的信息頭,如Data,Pragma數組
主要: Cache-Control , Connection , Data , Pragma , Trailer , Transfer-Encoding , Upgrade瀏覽器
(2)請求頭服務器
用於在請求消息中向服務器傳遞附加信息,主要包括客戶機能夠接受的數據類型,壓縮方法,語言,以及客戶計算機上保留的信息和發出該請求的超連接源地址等.網絡
主要: Accept , Accept-Encoding , Accept-Language , Host ,app
(3)響應頭jsp
用於在響應消息中向客戶端傳遞附加信息,包括服務程序的名稱,要求客戶端進行認證的方式,請求的資源已移動到新地址等.ide
主要: Location , Server , WWW-Authenticate(認證頭)測試
(4)實體頭
用作實體內容的元信息,描述了實體內容的屬性,包括實體信息的類型,長度,壓縮方法,最後一次修改的時間和數據的有效期等.
主要: Content-Encoding , Content-Language , Content-Length , Content-Location , Content-Type
(4)擴展頭
主要:Refresh, Content-Disposition
2. 幾個主要頭的做用
(1)Content-Type的做用
該實體頭的做用是讓服務器告訴瀏覽器它發送的數據屬於什麼文件類型。
例如:當Content-Type 的值設置爲text/html和text/plain時,前者會讓瀏覽器把接收到的實體內容以HTML格式解析,後者會讓瀏覽器以普通文本解析.
(2)Content-Disposition 的做用
當Content-Type 的類型爲要下載的類型時 , 這個信息頭會告訴瀏覽器這個文件的名字和類型。
在講解這個內容時,張老師同時講出瞭解決中文文件名亂碼的解決方法,日常想的是使用getBytes() , 實際上應使用email的附件名編碼方法對文件名進行編碼,但IE不支持這種做法(其它瀏覽器支持) , 使用javax.mail.internet.*包的MimeUtility.encodeWord("中文.txt")的方法進行編碼。
Content-Disposition擴展頭的例子:
<%@ page pageEncoding="GBK" contentType="text/html;charset=utf-8" import="java.util.*,java.text.*" %> <%=DateFormat.getDateTimeInstance(DateFormat.SHORT, DateFormat.SHORT, Locale.CHINA).format(new Date()) %> <% response.setHeader("Content-Type","video/x-msvideo"); response.setHeader("Content-Disposition", "attachment;filename=aaa.doc"); %>
Content-Disposition中指定的類型是文件的擴展名,而且彈出的下載對話框中的文件類型圖片是按照文件的擴展名顯示的,點保存後,文件以filename的值命名,保存類型以Content中設置的爲準。
注意:在設置Content-Disposition頭字段以前,必定要設置Content-Type頭字段。
(3)Authorization頭的做用
Authorization的做用是當客戶端訪問受口令保護時,服務器端會發送401狀態碼和WWW-Authenticate響應頭,要求客戶機使用Authorization來應答。
例如:
<%@ page pageEncoding="GBK" contentType="text/html;charset=utf-8" import="java.util.*,java.text.*" %> <%=DateFormat.getDateTimeInstance(DateFormat.SHORT, DateFormat.SHORT, Locale.CHINA).format(new Date()) %> <% response.setStatus(401); response.setHeader("WWW-Authenticate", "Basic realm=\"Tomcat Manager Application\""); %>
3.如何實現文件下載
要實現文件下載,咱們只須要設置兩個特殊的相應頭,它們是什麼頭?若是文件名帶中文,該如何解決?
兩個特殊的相應頭:
----Content-Type: application/octet-stream
----Content-Disposition: attachment;filename=aaa.zip
例如:
response.setContentType("image/jpeg");response.setHeader("Content- Disposition","attachment;filename=Bluehills.jpg");
若是文件中filename參數中有中文,則就會出現亂碼。
解決辦法:
(1)MimeUtility.encodeWord("中文.txt");//如今版本的IE還不行
(2)new String("中文".getBytes("GB2312"),"ISO8859- 1");//實際上這個是錯誤的
4. 測試並分析文件名亂碼問題
response.setHeader()下載中文文件名亂碼問題
response.setHeader("Content-Disposition", "attachment; filename=" + java.net.URLEncoder.encode(fileName, "UTF-8"));
下載的程序裏有了上面一句,通常在IE6的下載提示框上將正確顯示文件的名字,不管是簡體中文,仍是日文。不過當時確實沒有仔細測試文件名爲很長的中文文件名的狀況。現現在通過仔細測試,發現文字只要超過17個字,就不能下載了。分析以下:
一. 經過原來的方式,也就是先用URLEncoder編碼,當中文文字超過17個時,IE6 沒法下載文件。這是IE的bug,參見微軟的知識庫文章 KB816868 。緣由多是IE在處理 Response Header 的時候,對header的長度限制在150字節左右。而一個漢字編碼成UTF-8是9個字節,那麼17個字即是153個字節,因此會報錯。並且不跟後綴也不對.
二. 解決方案:將文件名編碼成ISO8859-1是有效的解決方案,代碼以下:
response.setHeader( "Content-Disposition", "attachment;filename=" + new String( fileName.getBytes("gb2312"), "ISO8859-1" ) );
在確保附件文件名都是簡體中文字的狀況下,那麼這個辦法確實是最有效的,不用讓客戶逐個的升級IE。若是臺灣同胞用,把gb2312改爲big5就行。但如今的系統一般都加入了 國際化的支持,廣泛使用UTF-8。若是文件名中又有簡體中文字,又有繁體中文,還有日文。那麼亂碼便產生了。另外,在上Firefox (v1.0-en)下載也是亂碼。
三. 參看郵件中的中文附件名的形式,用outlook新建一個帶有中文附件的郵件,而後看這個郵件的源代碼,找到:
Content-Disposition: attachment;
filename="=?gb2312?B?0MK9qCDOxLG+zsS1tS50eHQ=?="
用這個filename原理上就能夠顯示中文名附件,可是如今IE並不支持,Firefox是支持的。嘗試使用 javamail 的MimeUtility.encode()方法來編碼文件名,也就是編碼成 =?gb2312?B?xxxxxxxx?= 這樣的形式,並從 RFC1522 中找到對應的標準支持。
折中考慮,結合了1、二的方式,代碼片段以下:
String fileName = URLEncoder.encode(atta.getFileName(), "UTF-8");
/*
* see http://support.microsoft.com/default.aspx?kbid=816868
*/
if (fileName.length() > 150) {
String guessCharset = xxxx
//根據request的locale 得出可能的編碼,中文操做系統一般是gb2312
fileName = new String(atta.getFileName().getBytes(guessCharset), "ISO8859-1");
}
response.setHeader("Content-Disposition", "attachment; filename=" + fileName);
編碼轉換的原理:
首先在源程序中將編碼設置成GB2312字符編碼,而後將源程序按Unicode編碼轉換成字節碼加載到內存中(java加載到內存中的字節碼都是Unicode編碼),而後按GB2312編碼得到中文字符串的字節數組,而後生成按ISO8859-1編碼形式的Unicode字符串(這時的4個字節就變成了8個字節,高位字節補零),
當在網絡中傳輸時,由於setHeader方法中的字符只能按ISO8859-1傳輸,因此這時候就又把Unicode字符轉換成了ISO8859-1的編碼傳到瀏覽器(就是把剛纔高位補的零全去掉),這時瀏覽器接收到的ISO8859-1碼的字符由於符合GB2312編碼,因此就能夠顯示中文了。
5. jsp翻譯成class時的編碼問題
記事本中代碼塊1:
<%= "a中文".length() %> 代碼塊2: <%@ page pageEncoding="gbk"%> <%= "a中文".length() %>
爲何上面的輸出值爲5,改爲下面的則輸出3?
由於上面的代碼沒有添加該文件的編碼說明 , WEB應用程序在將jsp翻譯成class文件時 , 把該字符串的內容按默認的保存方式指定的編碼ASCII碼來算的,在UTF-8中,原ASCII字符佔一個字節,漢字佔兩個字節,對應兩個字符,長度就變成了5 , 而下面的是GBK編碼, 一個漢字和一個英文都對應一個字符,獲得結果就爲3.
]
response.setHeader(...)文件名中有空格的時候
String fileName = StringUtils.trim(file.getName()); String formatFileName = encodingFileName(name);//在後面定義方法encodingFileName(String fileName); response.setHeader("Content-Disposition", "attachment; filename=" + formatFileName );
//處理文件名中出現的空格
//其中%20是空格在UTF-8下的編碼
public static String encodingFileName(String fileName) { String returnFileName = ""; try { returnFileName = URLEncoder.encode(fileName, "UTF-8"); returnFileName = StringUtils.replace(returnFileName, "+", "%20"); if (returnFileName.length() > 150) { returnFileName = new String(fileName.getBytes("GB2312"), "ISO8859-1"); returnFileName = StringUtils.replace(returnFileName, " ", "%20"); } } catch (UnsupportedEncodingException e) { e.printStackTrace(); if (log.isWarnEnabled()) { log.info("Don't support this encoding ..."); } } return returnFileName; }
本文來自CSDN博客,轉載請標明出處:http://blog.csdn.net/fanyuna/archive/2010/05/07/5568089.aspx