APK文件結構詳解

前言

最近有業務需求,須要向已經打包的APK裏面注入渠道(channel)信息,方便APK下載安裝以後進行渠道歸因。向APK裏面注入渠道信息已經有比較成熟的方案美團walle。walle的強大和實現原理本文再也不贅述。爲了理解walle的代碼,而且在出現異常case的時候,可以本身解決。必需要對APK文件的結構瞭如指掌。html

所以,本文的目的就是以一個簡單的利用walle向APK裏面注入渠道號爲例。帶你瞭解APK裏面的各類細節,相信讀者在看完此篇文章以後,再閱讀walle的代碼的時候必定豁然開朗。java

ZIP和APK文件格式概覽

ZIP文件格式概覽

APK文件本質上是一個ZIP文件,所以在瞭解APK的格式以前必須先了解ZIP文件的格式。詳情參見zip文件格式詳解android

ZIP文件的總體格式以下圖所示,主要由三部分組成git

  • 數據區(Contents of ZIP entries):存儲文件壓縮內容
  • 中央目錄區(Central Directory Header):存儲zip文件裏面包含的全部目錄
  • 中央目錄結尾記錄(End of Central Directory Record:ECDR):存儲zip文件的總體信息

zip文件的總體格式

其中,中央目錄結尾記錄對於理解本文最爲重要。最好看完zip文件格式詳解 再繼續往下閱讀。此區域裏面有一個值核心目錄偏移地址很是的重要,如下圖爲例的話,核心目錄的起始地址就是0x2D(注意:是地址,不是數值)github

APK文件格式概覽

APK在簽名(V2/V3簽名)以後,會在數據區和中央目錄區之間插入APK簽名區(APK Signing Block)工具

APK簽名區的組成結構以下圖所示google

用表格表示以下圖所示,其由4部分組成.net

  1. Block長度:APK簽名區域總長度,包含後面3部分長度的總和
  2. ID-Value序列:後面會詳細講解
  3. Block長度:同1的值徹底相同
  4. 魔數:APK Sig Block 42,hex大端表示的話就是:41 50 4b 20 3 69 67 20 42 6c 6f 63 6b 20 34 32

ID-Value序列裏面存儲了ID-Value列表,ID-Value序列的結構以下圖所示。3d

列表的每個Item裏面由3個元素組成(8字節長度+4字節ID+內容)。其中APK的簽名信息就是其中一項item,ID爲0x7109871a。序列裏面的每個Item的結構以下圖所示:code

至於APK是如何計算簽名簽名信息保存在Item裏面,以及Android系統是如何校驗APK完整性的,詳情參考APK簽名機制之——V2簽名機制詳解walle的實現原理就是向ID-Value列表裏面插入一個Item,因爲APK安裝的時候並不對插入的Item作校驗,所以可以保證APK能校驗成功的同時還能帶上插入的信息

至此,咱們對APK文件的基本結構有了一個總體的認識。下面,我將以上述的實例APK爲例子,經過二進制分析如何一步一步提取出walle注入的ID=0x71777777的渠道信息

例子簡介

基於wall,向APK裏面注入渠道號信息。在APK打包的時候,向APK裏面注入一下信息。

APK運行的時候,能夠成功提取出渠道號信息

實例分析

實例分析前,咱們再回顧一下APK的總體格式(這張圖對後面步驟的理解很重要)

從APK裏面尋找存ID=0x71777777的渠道信息的總體過程以下:

  1. 肯定中央目錄地址(中央目錄地址恰好是APK簽名地址的尾地址)
  2. 根據中央目錄地址和APK簽名塊的長度肯定ID-Value序列的首地址和尾地址
  3. 分析ID-Value塊的結構,找到ID=0x71777777的內容部分,找到的內容就是咱們注入的信息

注意,在閱讀二進制文件的時候都要把實際的數字轉成小端來看

ZIP文件是按照小端存儲的(除特殊部分,好比說magic部分),好比說0x7109871A,實際存儲16進制存儲爲:1A 87 09 71。關於大端和小端的區別能夠參考大端和小端

一、肯定中央目錄的起始地址

中央目錄結構以下所示,zip文件格式詳解 裏面詳細介紹了中央目錄結尾記錄的結構

(1)咱們首先根據ECDR的魔數0x06054b50(hex:50 4b 05 06)肯定ECDR部分的起始地址爲0xBD396

(2)日後偏移16個地址(參考上圖),便可計算出中央目錄起始地址爲0x0b4f18

二、計算ID-Value塊起始地址

咱們再簡單回顧一下APK簽名塊的格式

(1)咱們首先跳轉到0x0b4f18地址所在位置

  • 從右邊的預覽裏面咱們能夠看到地址的前面恰好就是簽名塊結尾的魔數APK Sig Block 42
  • 能夠證實此地址恰好就是中央目錄起始地址

(3)往前16個地址(魔數長度)取8個字節(block長度佔8字節)既爲APK簽名塊的長度

  • 8405000000000000 16進制小端爲 0x0584

(4)所以從APK Sig Block 42的尾地址(0xb4f17)往前0x0584個地址,就是ID-Value部分的起始地址

  • 能夠看出前8個字節恰好也是8405000000000000,兩個長度Block的值相同,和預期相符合
  • 最下面標紅部分能夠看出計算出來的長度恰好是0x584
  • ID-VALUE的起始地址=0xb4f17-0x584+1=0xb4994
  • 最下面是開始地址(0xb4994)和結束地址(0xb4f17)

三、解析出ID=0x71777777的注入信息

再複習一下ID-Value序列Item每個Item的結構

根據步驟二咱們能夠得知ID-Value部分是從(43 05 00 到6E 22 7D,上圖的兩個紅框之間)。理論上,咱們根據上述Item的結構,順序從ID-Value序列的首地址解析到尾地址便可找出咱們的注入的信息。爲了方便起見,咱們直接在這部分搜索Id=0x71777777(hex: 77 77 77 71)的內容。能夠看出

  • 長度:00 00 00 00 00 00 00 19=25 (長度是25字節)
  • ID:71 77 77 77 (咱們自定義的)
  • 存入內容: {"channel":"meituan"} 21字節
  • 21+4=25,恰好等於長度的值

至此,咱們就成功的經過分析APK的二進制數據,獲得了walle注入的數據。固然,walle注入的過程也是相似的,很是的簡單。除此以外walle還考慮了V3對齊的問題

當你通過上述步驟分析以後,再去看walle的代碼,你會發現,媽的!原來這麼簡單!!

參考文獻

相關文章
相關標籤/搜索