1 import info.monitorenter.cpdetector.io.ASCIIDetector; 2 import info.monitorenter.cpdetector.io.CodepageDetectorProxy; 3 import info.monitorenter.cpdetector.io.JChardetFacade; 4 import info.monitorenter.cpdetector.io.ParsingDetector; 5 import info.monitorenter.cpdetector.io.UnicodeDetector; 6 7 import java.io.File; 8 9 /** 10 * @author zhanghf E-mail:zhanghf@yintong.com.cn 11 * @version 建立時間:2014-3-26 上午11:59:36 12 * 獲取文件編碼類 13 */ 14 public class EncodeUtil { 15 16 /** 17 * 利用第三方開源包cpdetector獲取文件編碼格式 18 * 19 * @param path 20 * 要判斷文件編碼格式的源文件的路徑 21 * @author huanglei 22 * @version 2012-7-12 14:05 23 */ 24 public static String getFileEncode(String path) { 25 /* 26 * detector是探測器,它把探測任務交給具體的探測實現類的實例完成。 27 * cpDetector內置了一些經常使用的探測實現類,這些探測實現類的實例能夠經過add方法 加進來,如ParsingDetector、 28 * JChardetFacade、ASCIIDetector、UnicodeDetector。 29 * detector按照「誰最早返回非空的探測結果,就以該結果爲準」的原則返回探測到的 30 * 字符集編碼。使用須要用到三個第三方JAR包:antlr.jar、chardet.jar和cpdetector.jar 31 * cpDetector是基於統計學原理的,不保證徹底正確。 32 */ 33 CodepageDetectorProxy detector = CodepageDetectorProxy.getInstance(); 34 /* 35 * ParsingDetector可用於檢查HTML、XML等文件或字符流的編碼,構造方法中的參數用於 36 * 指示是否顯示探測過程的詳細信息,爲false不顯示。 37 */ 38 detector.add(new ParsingDetector(false)); 39 /* 40 * JChardetFacade封裝了由Mozilla組織提供的JChardet,它能夠完成大多數文件的編碼 41 * 測定。因此,通常有了這個探測器就可知足大多數項目的要求,若是你還不放心,能夠 42 * 再多加幾個探測器,好比下面的ASCIIDetector、UnicodeDetector等。 43 */ 44 detector.add(JChardetFacade.getInstance());// 用到antlr.jar、chardet.jar 45 // ASCIIDetector用於ASCII編碼測定 46 detector.add(ASCIIDetector.getInstance()); 47 // UnicodeDetector用於Unicode家族編碼的測定 48 detector.add(UnicodeDetector.getInstance()); 49 java.nio.charset.Charset charset = null; 50 File f = new File(path); 51 try { 52 charset = detector.detectCodepage(f.toURI().toURL()); 53 } catch (Exception ex) { 54 ex.printStackTrace(); 55 } 56 if (charset != null) 57 return charset.name(); 58 else 59 return null; 60 } 61 62 }