Android 項目通常使用 gradle 做爲構建打包工具,而其執行速度慢也一直爲人所詬病,對於今日頭條 Android 項目這種千萬行級別的大型工程來講,全量編譯一次的時間可能高達六七分鐘,在某些須要快速驗證功能的場景,改動一行代碼的增量編譯甚至也須要等兩三分鐘,這般龜速嚴重影響了開發體驗與效率,所以針對 gradle 編譯構建耗時進行優化顯得尤其重要。java
在今日頭條 Android 項目上,編譯構建速度的優化和惡化一直在交替執行,18 年時因爲模塊化拆分等影響,clean build 一次的耗時達到了頂峯 7 分 30s 左右,相關同窗經過模塊 aar 化,maven 代理加速,以及增量 java 編譯等優化手段,將 clean build 耗時優化到 4 分鐘,增量編譯優化到 20~30s 。可是後面隨着 kotlin 的大規模使用,自定義 transform 以及 apt 庫氾濫,又將增量編譯速度拖慢到 2 分 30s ,且有進一步惡化的趨勢。爲了優化現有不合理的編譯耗時,防止進一步的惡化,最近的 5,6 雙月又針對編譯耗時作了一些列專項優化(kapt,transform,dexBuilder,build-cache 等) 並添加了相關的防惡化管控方案。 從 4.27 截止到 6.29 ,總體的優化效果以下:android
因爲 18 年左右客戶端基礎技術相關同窗已經對今日頭條 Android 工程作了許多 gradle 相關的優化,且這些優化是近期優化的基礎,所以先挑選幾個具備表明性的方案進行介紹,做爲下文的背景同步。git
gradle 工程每每會在 repositories 中添加一些列的 maven 倉庫地址,做爲組件依賴獲取的查找路徑,早期在今日頭條的項目中配置了十幾個 maven 的地址,可是依賴獲取是按照 maven 倉庫配置的順序依次查找的,若是某個組件存在於最後一個倉庫中,那前面的十幾個倉庫得依次發起網絡請求查找,並在網絡請求返回失敗後才查找下一個,若是項目中大多組件都在較後倉庫的位置,累加起來的查找時間就會很長。github
今日頭條項目進行了屢次組件化和模塊化的重構,分拆出了 200 多個子模塊,這些子模塊若是全都 include 進項目,那麼在 clean build 的時候,全部子模塊的代碼須要從新編譯,而對於大多數開發人員來講,基本上只關心本身負責的少數幾個模塊,根本不須要改動其餘模塊的代碼,這些其餘 project 的配置和編譯時間就成爲了避免必要的代價。web
對於以上子模塊過多的解決方案是:將全部模塊發佈成 aar ,在項目中所有默認經過 maven 依賴這些編譯好的組件,而在須要修改某個模塊時,經過配置項將該模塊的依賴形式改成源碼依賴,作到在編譯時只編譯改動的模塊。可是這樣作會致使模塊漸漸的又所有變爲源碼依賴的形式,除非規定每次修改完對應模塊後,開發人員本身手動將模塊發佈成 aar ,並改回依賴形式。這種嚴重依賴開發人員自覺,而且在模塊數量多依賴關係複雜的時候會顯得異常繁瑣,所以爲了開發階段的便利,設計了一整套更完整細緻的方案:json
經過上述改造,將源碼模塊切換成 aar 依賴後,clean build 耗時從 7,8 分鐘下降至 4,5 分鐘,收益接近 50%,效果顯著。api
在非 clean build 的狀況下,更改 java/kotlin 代碼雖然會作增量編譯,可是爲了絕對的正確性,gradle 會根據一些列依賴關係計算,選擇須要從新編譯的代碼,這個計算粒度比較粗,稍微改動一個類的代碼,就可能致使大量代碼從新執行 apt, 編譯等流程。緩存
因爲 gradle 做爲通用框架,其設計的基本原則是絕對的正確,所以很容易致使增量編譯失效,在實際開發中,爲了快速編譯展現結果,能夠在編譯正確性和編譯速度上作一個折中的方案:性能優化
以上方案(下文所有簡稱爲 fastbuild) 雖然在涉及常量修改,方法簽名變動方面 存在必定的問題(常量內聯等),可是能換來增量編譯從 2 分多下降至 20~30s,極大的提高編譯效率,且有問題的場景並不常見,所以總體上該方案是利大於弊的。網絡
經過上文介紹的幾個優化方案和其餘優化方式,在 18 年時,今日頭條 Android 項目的總體編譯速度(clean build 4~5min, fast 增量編譯 20~30s)在同量級的大型工程中來講是比較快的 ,然然後期隨着業務發展的需求,編譯腳本添加了不少新的邏輯:
這些邏輯的引入,使得增量編譯耗時惡化到 2 分 30s,即便採用 fastbuild,改動一行代碼編譯也須要 1 分 30s 之多,開發體驗很是差。而下文將着重描述最近一段時間對上述問題的優化過程。
今日頭條工程通過屢次模塊化,組件化重構後, app 模塊(NewsArticle)的大部分代碼都已經遷移到子模塊(上文已經介紹過子模塊能夠採用 aar 化用於編譯速度優化,app 模塊只剩下一個殼而已。
可是從 build profile 數據(執行 gradle 命令時添加 --profile 參數會在編譯完成後輸出相關 task 耗時的統計文件) 中發現到一個異常 case:明明只有 2 個類的 app 模塊 kapt(annotationProcessor 註解處理) 相關耗時近 1 分鐘。
經過進一步觀察,雖然 app 模塊拆分後只有 2 個簡單類的代碼,可是卻用了 6 種 kapt 庫, 且實際生效的只是其中 ServiceImpl 一個註解 (內部 ServiceManager 框架,用於指示生產 Proxy 類,對模塊之間代碼調用進行解耦)。如此一頓操做猛如虎,每次編譯卻只生成固定的兩個 Proxy 類,與 53s 的高耗時相比,投入產出比極低。
把固定生成的 Proxy 類從 generate 目錄移動到 src 目錄,而後禁止 app 模塊中 kapt 相關 task ,並添加相關管控方案(以下圖: 檢測到不合理狀況後馬上拋出異常),防止其餘人添加新增的 kapt 庫。
經過上文介紹在 app 模塊發現的異常的 kapt case, 進而發如今工程中爲了方便,定義了一個 library.gradle ,該文件的做用是定義項目中通用的 Android dsl 配置和共有的基礎依賴,所以項目中全部子模塊均 apply 了這個文件,可是這個文件陸陸續續的被不一樣的業務添加新的 kapt 註解處理庫,在全源碼編譯時,全部子模塊都得執行 library 模塊中定義的所有 6 個 kapt ,即便該模塊沒有任何註解相關的處理也不例外。
而上述狀況的問題在於:相比純 java 模塊的註解處理,kotlin 代碼須要先經過 kaptGenerateStub 將 kt 文件轉換成爲 java ,讓 apt 處理程序可以統一的面向 java 作註解掃描和處理。可是上面講到其實有不少模塊是根本不會有任何實際 kapt 處理過程的,卻白白的作了一次 kt 轉 java 的操做,源碼引入的模塊越多,這種無心義的耗時累加起來也很是可觀。
爲了可以弄清楚到底有哪些子模塊真正用到了 kapt ,哪些沒用到能夠禁用掉 kapt 相關 task ,對項目中全部子模塊進行了一遍掃描:
使用上述方案,經過全源碼打包最終掃描出來大概是 70+模塊不會進行任何 kapt 的實際輸出,且將這些不會進行輸出的 kapt,kaptGenerateStub 的 task 耗時累加起來較高 217s (因爲 task 併發執行因此實際總時長可能要少一些).
獲取到不實際生成 kapt 內容的模塊後,開始對這些模塊進行細粒度的拆分,讓它們從 apply library.gradle 改成沒有 kapt 相關的 library-api.gradle ,該文件除了禁用 kapt 外,與 library 邏輯一致。
可是這樣作算是在背後偷偷作了些更改,極可能後續新來的同窗不知道有這種優化手段,可能新增了註解後卻沒有任何輸出且找不到緣由,而優化效果最好是儘可能少給業務同窗帶來困擾。爲了不這種狀況,便對這些 library-api 模塊依賴的註解作隔離優化,即:把這些模塊依賴的註解庫所有 自動 exclude 掉,在嘗試使用註解時會因獲取不到引用(以下圖所示),第一時間發現到依賴被移除的問題。
另外一方面在編譯出現錯誤時,對應 gradle 插件會自動解析找不到的符號,若是發現該符號是被隔離優化的註解,會提示將 library-api 替換成 library,儘量下降優化方案對業務的負面影響。
transform 做爲 Android gradle plugin 提供給開發者的 API,用於在 apk 構建過程當中,對 class 字節碼,resources 等文件內容進行插樁修改,例如官方的 dex, proguard 等功能均由此 api 實現。
對於今日頭條這種大型工程來講,有不少諸如性能插樁、自動埋點插樁等相關需求,所以基於此 api 開發了大量 transform,用於實現特定功能,可是這些 transform 基本上都是不支持增量編譯的,即便只改動了一行代碼,這 些 transform 都會遍歷全部 class 文件,解析字節碼中的方法字段信息,關鍵是這類 transform 數量有十幾個,將這些遍歷耗時乘以 10 累加以後,增量編譯耗時天然居高不下。
根據分析,其中性能插樁等相關 transform 作的一些面向線上的插樁方案是徹底能夠只在 release 打包時打開的,所以能夠直接在 debug 編譯時禁用這些功能,用於提高開發期間的編譯速度。而剩下的 9 個 transform 特徵比較類似,可能在一些插樁細節上有所不一樣,它們大體的處理邏輯爲:
因爲這 9 個自定義 transform 的功能如此相似,便決定將這些 transform 合併成一個,這樣同一個文件的讀寫操做只執行一次,而且能夠作定製化的增量編譯優化。雖然公司內有相似的 transform 合併優化方案 byteX ( 已在 github 開源),可是因爲今日頭條項目在 debug 階段未開啓該功能,且 ByteX 作了一些諸如 ClassGrapth 的構建,對類文件作兩次遍歷等操做,對於實現類信息收集和信息注入 這個功能來講,byteX 顯得比較重 ,因而仍然針對類信息收集註入功能這個細分場景開發了一個收斂框架。
該框架完成了內部 9 種類信息收集註入相關框架的收斂,編譯耗時的絕對值加速了 25s 左右,且因爲提供了統一的增量緩存功能,使得改動一行代碼的耗時能夠從 2 分 30s 下降到 35~40s ,實現了增量編譯速度大的飛躍。最關鍵的是將全部自定義 transform 統一管控後,後續能夠作統必定製化的需求,進一步優化編譯速度。
在 Android debug 編譯 過程當中,最主要的耗時在 transform 上,而上文 介紹 今日頭條項目自定義 transform 已經被高度優化過,剩下的 dexBuilder(將 class 轉換成 dex ) ,dexMerge 等 task 耗時就成爲了性能瓶頸,dexBuilder 全量編譯耗時 60s 左右,增量編譯耗時 22s 左右。
根據 DexArchiveBuilderTransform 關鍵方法 launchProcessing 裏面關鍵一行 isDirectoryBased,若是是目錄類型的輸入,會根據具體變更 class 文件作增量的 dex 編譯 ,可是若是是 jar 輸入類型,那隻要 jar 裏任何一個類變更,則整個 jar 全部類都須要重執行 dex,可是因爲 gradle 的依賴特性,基本上只有 app 模塊是目錄類的輸入,其餘 library 都是 jar 輸入類型,對於比較大的業務模塊 ,若是該模塊有幾千個類,那每改動一次類,就會有幾千類連帶從新 執行 dex 編譯。
在優化前爲了獲得真正的從新執行 dex 編譯的數值,作到最佳優化,設計了一套 hook dex 編譯流程的方法(該方法理論上能夠 hook Android gradle plugin 任意類:大體就是 hook classLoader ,提早用 asm 修改 D8DexArchiveBuilder 中的 convert 方法
經過對 D8DexArchiveBuilder 的 hook ,統計到優化前改動一行代碼會連帶着 24968 個類從新執行 dex 編譯,增量效果很是差。
既然 jar 輸入相比於 目錄輸入來講增量編譯效果很是差,那麼能夠想到 hook TransformInvocation 中的 input 方法,動態將 project 的 jar 類型輸入(JarInput)映射爲一個 目錄輸入(DirectoryInput),那麼子模塊修改對應代碼時,只從新編譯目錄中被修改的 class 爲 dex(而不是原來的整個 jar 內全部 class 從新執行 dex 編譯),總體 dex 從新編譯的數量將大幅度減小。實現具體方案以下:
而 jar 轉 目錄的映射細節爲:
在第一次增量修改完成後,從新執行 dex 編譯的類數量下降至 2152 個,可是其中仍然有不少迷惑的不應執行 dex 編譯的類,預期是修改多少類,就從新執行 多少次 dex,所以繼續對其中緣由進行進一步的探索
因爲 java8 的字節碼有些指令在 Android 虛擬機中並不能獲得支持,會在編譯流程中,將這些指令進行脫糖,轉換成已有的指令,而 d8 中 desugar 的流程合併到了 dexBuilder 中,爲了不某些類 desugar 後,依賴它的類的行爲正確,須要把依賴它的全部類從新執行一遍 dex 編譯。
而 d8 會根據 DesugaringGraph 查找 desguar 有變更的類及其依賴的 jar 包,如圖下面得到到的 addtionalPaths 是 desguar 類可能直接間接相關的 jar 包,即便這些 jar 包沒有任何文件內容變動,其中全部類也得從新所有執行一次 dex 編譯。
該類用來輔助獲取依賴或間接依賴到變動文件的全部文件,而它的生成邏輯爲: 全量或增量編譯類的時候記錄類型之間的依賴和被依賴關係,依賴關係的判斷條件有
DesugaringGraph 不只記錄了類依賴的類,和依賴它的類,同時也記錄了一個文件路徑包含了哪些類
在增量編譯時檢查到變更的文件時,會檢查這個文件路徑包含的全部類, 而後遞歸查找全部直接/間接依賴它的類,而且找到這些依賴它的類後,會把這個類所在的 jar 包做爲額外的處理類型(即便 jar 自己沒有任何變更,裏面全部的類仍然須要從新 dex 編譯)
順着這個解析關係,找到了一個不正常的 jar 包 bdjson_api ,這個 jar 只有 3 個文件 (IBDJson,BDJsonCollector, BDJsonConstants) 。可是 BDJsonCollector 是一個 stub 類,每次執行 transform 會收集到其餘類的信息而後往該類的方法中注入,所以該文件每次編譯時都會變更。 這個類自己並無多少直接依賴它的類,主要是 它所在的 jar 包還有個 IBDJson 接口。
按照以前的 DesugaringGraph 依賴關係,全部 IBDJson 接口的實現類被判斷爲依賴它,而後這些實現類若是出如今某個 dynamic 方法中,又會被層層查找,查找完了以後,還得計算全部依賴類所在的 jar 包,jar 包中其餘沒有依賴它的類也會被從新 dex 編譯, 在這個 case 的依賴查找中,連帶從新執行 dex 編譯的類數量並很少,大概爲 4 個 jar 包共 2000 多個類從新執行了無心義的 dex 流程,可是若是是其餘 sdk jar 包,則可能就會給 dexBuilder 增量帶來毀滅性的打擊。 上述問題的解決方法:
修復後修改一行代碼從新執行 dex 的數量爲 10 ,其中 9 個是每次 transform 會修改的 stub 類,1 個是實際修改類。作到了真正的 改多少類,執行屢次 dex 編譯。
assemebleDebug 的增量編譯中從原來(上文 transform 優化後)的 35s~40s 是下降至均值 17s,在 fast build 中效果最明顯(屏蔽了 apt),第二次增量編譯能突破到 9s 實現秒級編譯。
而通過上面全部的優化後,耗時數據裏耗時最嚴重的 dexBuilder 和 dex-merge 基本都下降在 1s 左右,自定義 transform 也是 1s 左右,其餘 task 基本都是零點幾秒。在不使用 hotfix 方案的狀況下(因爲今日頭條項目使用了過多的自定義 transform 和插件方案,因此很差使用 instantrun 等 hostfix 方案),相關 task 的耗時基本達到了優化的極限。
Build-cache 是 gralde 提供的一個編譯緩存方案,目的是在構建過程當中當兩個 task 的輸入相同時,能夠複用緩存內容,直接跳過 task 的執行拿到緩存好的執行結果。因爲緩存結果既能夠放在本地磁盤,也能夠從遠程獲取,所以容易想到利用 ci 提早構建緩存包,在其餘 ci 機器和開發時利用緩存包得到加速效果。
那麼如何判斷 task 能夠直接獲取 以前 task 的緩存內容做爲輸出呢?定義爲可緩存的 task ,會定義一些緩存相關的屬性,task 執行時經過文件指紋,緩存屬性等一大堆屬性計算出緩存 key ,用於查找是否命中緩存,計算維度有:
可是原生的 build-cahce 在緩存命中率上慘不忍睹,公司內抖音團隊基於 gradle4.x 的源碼作過一些提升命中率的修改,不過今日頭條用的 gradle 版本是 5.1 ,受抖音團隊的啓發,也對 gradle5.1 源碼作了些定製化的修改,用於 dump 緩存 key 的計算流程,快速發現緩存問題。相比於抖音發現的一些影響緩存命中的問題,額外發現了一些諸如 mbox , kapt 元素遍歷順序不固定的問題,這裏只挑一個典型的 apt 順序不一致的問題進行介紹:
通過修改 gradle5.1 源碼後對編譯流程的信息採集,發現有的 task 緩存沒法命中是由於 kapt 時,不少生成代碼塊邏輯是同樣的,可是順序不同(以下圖 demo :下面兩個生成方法的邏輯一致,可是判斷順序不一致,這應該是在 processor 中經過 RoundEnviroment 獲取到 註解元素 elemnts 順序不一致致使的 )
其內部的緣由多是文件遍歷目錄時獲取子文件的順序不一致,致使了子文件對應註解元素的順序也不一致, 總之這個操做影響了生成文件內代碼的順序,也影響了該文件的 hash 計算結果,致使 build-cache 在計算 javac task 的 key 時會錯亂致使緩存沒法命中。
可是注意到 AbstractProcessor 的核心方法 process 的兩個參數都是接口,所以想到能夠代理原來的 RoundEnvironment 接口,將其 getElementXx 的方法通過固定排序後返回,使得 apt 註解元素的順序可以固定下來。
因爲篇幅影響,其餘影響緩存命中相關的 case 略(主要是一些涉及到文件絕對路徑, classPath 相關的問題)
在今日頭條這種大型工程中,有不少業務部門參與開發,僅 Android 工程 開發人員就有幾百人且人員變更頻繁,所以內部任何一項優化工做必然是得搭配上一些管控措施的,不然一邊優化一邊惡化,空浪費人力。
爲此制定了一些管控方案,首先是 debug 階段的 新增 transform 管控,設置爲白名單形式,若是在開發階段新增了 transform 直接終止編譯流程,經過說明文檔告知管控的規則,固然,管控的目的是儘量減小一些沒必要要的不合理的編譯問題,並非與業務團隊做對,若是某一個操做拖慢了總體的編譯耗時,可是在 app 性能/穩定性方面有更大收益,且沒法在編譯期作更多的優化,仍然是容許添加的,只不過是得提早把這個問題暴露出來而已,能更快的找出更多的解決思路,好比引導使用 byteX 等 transform 收斂方案。
另外一方面的是合碼流程方面的阻塞 : 今日頭條 爲了保障 app 的性能穩定性,在合碼流程上設置了許多自動化的卡點: 如 包大小檢測,插件依賴變動檢查, so 變動檢查,啓動性能檢測等,檢測到對應問題(如包大小增長異常)會阻塞合碼流程。爲了管控編譯速度 ,使其不至於惡化的太快,也加上了對應的 基於 task 級別的管控,當某一個 task 耗時異常波動,或者新增全新類型的 task 時,可以自動的發現問題,經過機器人將相關人員拉到 mr 討論羣中, 儘可能在 合碼完成前能發現問題。
爲了持續穩定的保持較快的編譯速度,可能須要作到如下幾點:
字節跳動-GIP-Android 平臺架構團隊以服務今日頭條產品爲主,同時協助公司其餘產品,在產品性能、穩定性等用戶體驗,研發流程,編譯優化,架構方向上不斷優化和深刻探索,以知足產品快速迭代的同時,保持較高的用戶體驗。咱們長期招聘 Android 平臺架構方向的同窗,在北京,深圳均有相關崗位,想深刻交流或者須要部門內推、投遞簡歷的能夠聯繫郵箱 wangshupeng@bytedance.com (標題註明 : 字節跳動-GIP 平臺 android 部門直推)
歡迎關注字節跳動技術團隊