經過文件頭標識判斷圖片格式

圖片的格式不少,一個圖片文件的後綴名並不能說明這個圖片的真正格式什麼,那麼如何獲取圖片的格式呢?我想到了幾個簡單但有效的方法,那就是讀取圖片文件的文件頭標識。咱們知道各類格式的圖片的文件頭標識識不一樣的,所以咱們能夠經過判斷文件頭的標識來識別圖片格式。web

     我對各類格式的圖片文件頭標識進行了分析,不只查找資料,也用十六進制編輯器察看過圖片的文件頭,如下是我收集、分析的結果,供你們參考。編輯器

1.JPEG
- 文件頭標識 (2 bytes): $ff, $d8 (SOI) (JPEG 文件標識) 
- 文件結束標識 (2 bytes): $ff, $d9 (EOI)ide

2.TGA
- 未壓縮的前5字節   00 00 02 00 00
- RLE壓縮的前5字節   00 00 10 00 00優化

3.PNG
- 文件頭標識 (8 bytes)   89 50 4E 47 0D 0A 1A 0Aspa

4.GIF
- 文件頭標識 (6 bytes)   47 49 46 38 39(37) 61
          9 (7)     aorm

5.BMP
- 文件頭標識 (2 bytes)   42 4D
  M圖片

6.PCX
- 文件頭標識 (1 bytes)   0A內存

7.TIFF
- 文件頭標識 (2 bytes)   4D 4D 或 49 49ci

8.ICO
- 文件頭標識 (8 bytes)   00 00 01 00 01 00 20 20字符串

9.CUR
- 文件頭標識 (8 bytes)   00 00 02 00 01 00 20 20

10.IFF
- 文件頭標識 (4 bytes)   46 4F 52 4D
      M

11.ANI
- 文件頭標識 (4 bytes)   52 49 46 46
          F

     根據這些文件頭標識的收集,我能夠寫一個識別圖像格式的模塊了。可是在寫這個模塊以前能夠對收集到的文件頭標識進行優化,使得程序中字符串比對次數儘可能的少。

  1.JPEG咱們知須要比對文件頭的$ff, $d8這兩個字符,而不用讀取最後的兩個結束標識了。

  2.TGA,ICO,CUR只需比對第三個與第五個字符便可。

  3.PNG比對[89][50]這兩個字符。

  4.GIF比對[47][49][46]與第五個字符。

  廢話很少說了,利用內存流來判斷文件的格式,其實判斷文件的前幾個字節就能夠簡單的判斷這個文件是什麼類型的文件,例如

  jpg文件 是 FFD8 (從低位到高位就要反過來 D8FF 下面都是同樣)

  BMP文件 是 424D ---4D42

  其餘的我就不一一列舉了,想知道跟多文件類型分別是用什麼字符做爲文件的開頭的話,下載個C32asm或者UE等這類16進制編輯器就能夠看到了。

相關文章
相關標籤/搜索