java判斷文件真實類型

 代碼以下:html

import java.io.FileInputStream;
import java.io.IOException;
import java.util.HashMap;
/**
 * <p>
 * 類描述:獲取和判斷文件頭信息
 * |--文件頭是位於文件開頭的一段承擔必定任務的數據,通常都在開頭的部分。
 * |--頭文件做爲一種包含功能函數、數據接口聲明的載體文件,用於保存程序的聲明(declaration),而定義文件用於保存程序的實現(implementation)。
 * |--爲了解決在用戶上傳文件的時候在服務器端判斷文件類型的問題,故用獲取文件頭的方式,直接讀取文件的前幾個字節,來判斷上傳文件是否符合格式。
 */
public class CheckFileFormatUtil {
    // 緩存文件頭信息-文件頭信息
    private static final HashMap<String, String> mFileTypes = new HashMap<String, String>();
    static {
        // images
        mFileTypes.put("FFD8FF", "jpg");
        mFileTypes.put("89504E47", "png");
        mFileTypes.put("47494638", "gif");
        mFileTypes.put("49492A00", "tif");
        mFileTypes.put("424D", "bmp");
        //
        mFileTypes.put("41433130", "dwg"); // CAD
        mFileTypes.put("38425053", "psd");
        mFileTypes.put("7B5C727466", "rtf"); // 日記本
        mFileTypes.put("3C3F786D6C", "xml");
        mFileTypes.put("68746D6C3E", "html");
        mFileTypes.put("44656C69766572792D646174653A", "eml"); // 郵件
        mFileTypes.put("D0CF11E0", "doc");
        mFileTypes.put("D0CF11E0", "ppt");
        mFileTypes.put("D0CF11E0", "xls");//excel2003版本文件
        mFileTypes.put("5374616E64617264204A", "mdb");
        mFileTypes.put("252150532D41646F6265", "ps");
        mFileTypes.put("255044462D312E", "pdf");
        mFileTypes.put("504B0304", "pptx");
        mFileTypes.put("504B0304", "docx");
        mFileTypes.put("504B0304", "xlsx");//excel2007以上版本文件
        mFileTypes.put("52617221", "rar");
        mFileTypes.put("57415645", "wav");
        mFileTypes.put("41564920", "avi");
        mFileTypes.put("2E524D46", "rm");
        mFileTypes.put("000001BA", "mpg");
        mFileTypes.put("000001B3", "mpg");
        mFileTypes.put("6D6F6F76", "mov");
        mFileTypes.put("3026B2758E66CF11", "asf");
        mFileTypes.put("4D546864", "mid");
        mFileTypes.put("1F8B08", "gz");
    }
 
    /**
     * @param filePath 文件路徑
     * @return 文件頭信息
     * @author wlx
     * <p>
     * 方法描述:根據文件路徑獲取文件頭信息
     */
    public static String getFileType(String filePath) {
//        System.out.println(getFileHeader(filePath));
//        System.out.println(mFileTypes.get(getFileHeader(filePath)));
        return mFileTypes.get(getFileHeader(filePath));
    }
 
    /**
     * @param filePath 文件路徑
     * @return 文件頭信息
     * @author wlx
     * <p>
     * 方法描述:根據文件路徑獲取文件頭信息
     */
    public static String getFileHeader(String filePath) {
        FileInputStream is = null;
        String value = null;
        try {
            is = new FileInputStream(filePath);
            byte[] b = new byte[4];
            /*
             * int read() 今後輸入流中讀取一個數據字節。int read(byte[] b) 今後輸入流中將最多 b.length
             * 個字節的數據讀入一個 byte 數組中。 int read(byte[] b, int off, int len)
             * 今後輸入流中將最多 len 個字節的數據讀入一個 byte 數組中。
             */
            is.read(b, 0, b.length);
            value = bytesToHexString(b);
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            if (null != is) {
                try {
                    is.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }
        return value;
    }
 
    /**
     * @param src 要讀取文件頭信息的文件的byte數組
     * @return 文件頭信息
     * @author wlx
     * <p>
     * 方法描述:將要讀取文件頭信息的文件的byte數組轉換成string類型表示
     */
    private static String bytesToHexString(byte[] src) {
        StringBuilder builder = new StringBuilder();
        if (src == null || src.length <= 0) {
            return null;
        }
        String hv;
        for (byte aSrc : src) {
            // 以十六進制(基數 16)無符號整數形式返回一個整數參數的字符串表示形式,並轉換爲大寫
            hv = Integer.toHexString(aSrc & 0xFF).toUpperCase();
            if (hv.length() < 2) {
                builder.append(0);
            }
            builder.append(hv);
        }
//        System.out.println(builder.toString());
        return builder.toString();
    }

    public static void main(String[] args) throws Exception {
        final String fileType = getFileType("E:\\項目管理清單.xlsx");
        System.out.println(fileType);
        System.out.println(getFileHeader("E:\\項目管理清單.xlsx"));
    }
}
View Code

 

附錄:魔數簡介java

不少類型的文件,其起始的幾個字節的內容是固定的(或是有意填充,或是本就如此)。
根據這幾個字節的內容就能夠肯定文件類型,所以這幾個字節的內容被稱爲魔數 (magic number)。數組

JPEG                             jpg;jpeg                      0xFFD8FF
PNG                              png                           0x89504E470D0A1A0A
GIF                              gif                           GIF8
TIFF                             tif;tiff                      0x49492A00
TIFF                             tif;tiff                      0x4D4D002A
AOL ART                          art                           0x4A47040E000000
AOL ART                          art                           0x4A47030E000000
PC Paintbrush                    pcx                           0x0A050108
Graphics Metafile                wmf                           0xD7CDC69A
Graphics Metafile                wmf                           0x01000900
Graphics Metafile                wmf                           0x02000900
Enhanced Metafile                emf                           0x0100000058000000
CAD                              dwg                           0x41433130
Outlook Express                  dbx                           0xCFAD12FE
MS Office/OLE2     doc;xls;dot;ppt;xla;ppa;pps;pot;msi;sdw;db  0xD0CF11E0A1B11AE1
WordPerfect                      wpd                           0xFF575043
Quicken                          qdf                           0xAC9EBD8F
QuickBooks Backup                qbb                           0x458600000600
Sage               sly.or.srt.or.slt;sly;srt;slt               0x53520100
Lotus WordPro v9                 lwp                           0x576F726450726F
Lotus 123 v9                     123                           0x00001A00051004
Lotus 123 v5                     wk4                           0x00001A0002100400
Lotus 123 v3                     wk3                           0x00001A0000100400
Lotus 123 v1                     wk1                           0x2000604060
Windows Password                 pwl                           0xE3828596
ZIP Archive                      zip;jar                       0x504B0304
ZIP Archive (outdated)           zip                           0x504B3030
GZ Archive                       gz;tgz                        0x1F8B08
ARJ Archive                      arj                           0x60EA
MPEG                             mpg;mpeg                      0x000001BA
MPEG                             mpg;mpeg                      0x000001B3
Windows Media                    asf                           0x3026B2758E66CF11
ELF Executable                   elf;;                         0x7F454C4601010100 
Java-Class                      class                          0xCAFEBABE
相關文章
相關標籤/搜索