原文:橘子不酸丶 [www.zyiner.com/article/5]node
最近因爲體驗感受咱們的app啓動時間過長,所以作了APP的啓動優化。本次優化主要從三個方面來作了啓動時間的優化,main以後的耗時方法優化、premain的+load方法優化、二進制重排優化premain時間。ios
一般咱們對於啓動時間的定義爲從用戶點擊app到看到首屏的時間。所以對於啓動時間優化就是遵循一個原則:儘早讓用戶看到首頁內容。json
iOS應用的啓動可分爲pre-main階段和main()階段,pre-main階段爲main函數執行以前所作的操做,main階段爲main函數到首頁展現階段。其中系統作的事情爲:markdown
一般的premain階段優化即爲刪減無用的類方法、減小+load操做、減小__attribute__((constructor))的C函數、減小啓動加載的動態庫。而main階段的優化爲將啓動時非必要的操做延遲到首頁顯示以後加載、統計並優化耗時的方法、對於一些能夠放在子線程的操做能夠儘可能不佔用主線程。app
咱們能夠經過Instruments的TimeProfile來統計啓動時的主要方法耗時,Call Tree->Hide System Libraries過濾掉系統庫能夠查看主線程下方法的耗時。 也能夠經過打印時間的方式來統計各個函數的耗時。iphone
double launchTime = CFAbsoluteTimeGetCurrent();
[SDWebImageManager sharedManager];
NSLog(@"launchTime = %f秒", CFAbsoluteTimeGetCurrent() - launchTime);
複製代碼
這一階段就是須要對啓動過程的業務邏輯進行梳理,確認哪些是能夠延遲加載的,哪些能夠放在子線程加載,以及哪些是能夠懶加載處理的。同時對耗時比較嚴重的方法進行review並提出優化策略進行優化。ide
一樣的咱們能夠經過Instruments來統計啓動時全部的+load方法,以及+load方法所用耗時 咱們能夠對沒必要要的+load方法進行優化,好比放在+initialize裏。沒必要要的+load進行刪減。函數
因爲在咱們的工程中存在不少的+load方法,而其中一大部分爲cell模板註冊的+load方法(咱們的每個cell對應一個模板,而後該模板對應一個字符串,在啓動時全部的模板方法都在+load中註冊對應的字符串即在字典中存儲字符串和對應的cell模板,而後動態下發展現對應的cell)。oop
即存在這種場景,在啓動時須要大量的在+load中註冊key-value。post
此時可使用__attribute((used, section("__DATA,"#sectname" ")))的方式在編譯時寫入"TempSection"的DATA段一個字符串。此字符串爲key:value格式的字典轉json。對應着key和value。
#ifndef ZYStoreListTemplateSectionName
#define ZYStoreListTemplateSectionName "ZYTempSection"
#endif
#define ZYStoreListTemplateDATA(sectname) __attribute((used, section("__DATA,"#sectname" ")))
#define ZYStoreListTemplateRegister(templatename,templateclass) \
class NSObject; char * k##templatename##_register ZYStoreListTemplateDATA(ZYTempSection) = "{ \""#templatename"\" : \""#templateclass"\"}";
/**
經過ZYStoreListTemplateRegister(key,classname)註冊處理模板的類名(類必須是ZYStoreListBaseTemplate子類)
【注意事項】
該方式經過__attribute屬性在編譯期間綁定註冊信息,運行時讀取速度快,註冊信息在首次觸發調用時讀取,不影響pre-main時間
該方式註冊時‘key’字段中不支持除下劃線'_'之外的符號
【使用示例】
註冊處理模板的類名:@ZYStoreListTemplateRegister(baseTemp,ZYStoreListBaseTemplate)
**/
複製代碼
在使用時@ZYStoreListTemplateRegister(baseTemp,ZYStoreListBaseTemplate)即爲在編譯期間綁定註冊信息。
讀取使用__attribute在編譯期間寫入的key-value字符串。 關於__attribute詳情能夠參考__attribute黑魔法
#pragma mark - 第一次使用時讀取ZYStoreListTemplateSectionName的__DATA全部數據
+ (void)readTemplateDataFromMachO {
//1.根據符號找到所在的mach-o文件信息
Dl_info info;
dladdr((__bridge void *)[self class], &info);
//2.讀取__DATA中自定義的ZYStoreListTemplateSectionName數據
#ifndef __LP64__
const struct mach_header *mhp = (struct mach_header*)info.dli_fbase;
unsigned long templateSize = 0;
uint32_t *templateMemory = (uint32_t*)getsectiondata(mhp, "__DATA", ZYStoreListTemplateSectionName, &templateSize);
#else /* defined(__LP64__) */
const struct mach_header_64 *mhp = (struct mach_header_64*)info.dli_fbase;
unsigned long templateSize = 0;
uint64_t *templateMemory = (uint64_t*)getsectiondata(mhp, "__DATA", ZYStoreListTemplateSectionName, &templateSize);
#endif /* defined(__LP64__) */
//3.遍歷ZYStoreListTemplateSectionName中的協議數據
unsigned long counter = templateSize/sizeof(void*);
for(int idx = 0; idx < counter; ++idx){
char *string = (char*)templateMemory[idx];
NSString *str = [NSString stringWithUTF8String:string];
if(!str)continue;
//NSLog(@"config = %@", str);
NSData *jsonData = [str dataUsingEncoding:NSUTF8StringEncoding];
NSError *error = nil;
id json = [NSJSONSerialization JSONObjectWithData:jsonData options:0 error:&error];
if (!error) {
if ([json isKindOfClass:[NSDictionary class]] && [json allKeys].count) {
NSString *templatesName = [json allKeys][0];
NSString *templatesClass = [json allValues][0];
if (templatesName && templatesClass) {
[self registerTemplateName:templatesName templateClass:NSClassFromString(templatesClass)];
}
}
}
}
}
複製代碼
這樣咱們就能夠優化大量的重複+load方法。並且使用__attribute屬性爲編譯期間綁定註冊信息,運行時讀取速度快,註冊信息在首次觸發調用時讀取,不影響pre-main時間。
自從抖音團隊分享了這篇 抖音研發實踐:基於二進制文件重排的解決方案 APP啓動速度提高超15% 啓動優化文章後 , 二進制重排優化 pre-main 階段的啓動時間自此被你們廣爲流傳。
當進程訪問一個虛擬內存Page而對應的物理內存卻不存在時,會觸發一次 缺頁中斷(Page Fault)。
二進制重排,主要是優化咱們啓動時須要的函數很是分散在各個頁,啓動時就會屢次Page Fault形成時間的損耗。
本次主要是經過Clang靜態插樁的方式,獲取到全部的啓動時調用的函數符號,導出爲OrderFile。
Target -> Build Setting -> Custom Complier Flags -> Other C Flags
添加 -fsanitize-coverage=func,trace-pc-guard
參數
而後實現hook代碼獲取全部啓動的函數符號。啓動後在首頁顯示以後,能夠經過觸發下邊-getAllSymbols方法獲取全部符號。
#import "dlfcn.h"
#import <libkern/OSAtomic.h>
複製代碼
void __sanitizer_cov_trace_pc_guard_init(uint32_t *start,
uint32_t *stop) {
static uint64_t N; // Counter for the guards.
if (start == stop || *start) return; // Initialize only once.
printf("INIT: %p %p\n", start, stop);
for (uint32_t *x = start; x < stop; x++)
*x = ++N; // Guards should start from 1.
}
//原子隊列
static OSQueueHead symboList = OS_ATOMIC_QUEUE_INIT;
static BOOL isEnd = NO;
//定義符號結構體
typedef struct{
void * pc;
void * next;
}SymbolNode;
void __sanitizer_cov_trace_pc_guard(uint32_t *guard) {
//if (!*guard) return; // Duplicate the guard check.
if (isEnd) {
return;
}
void *PC = __builtin_return_address(0);
SymbolNode * node = malloc(sizeof(SymbolNode));
*node = (SymbolNode){PC,NULL};
//入隊
// offsetof 用在這裏是爲了入隊添加下一個節點找到 前一個節點next指針的位置
OSAtomicEnqueue(&symboList, node, offsetof(SymbolNode, next));
}
- (void)getAllSymbols {
isEnd = YES;
NSMutableArray<NSString *> * symbolNames = [NSMutableArray array];
while (true) {
//offsetof 就是針對某個結構體找到某個屬性相對這個結構體的偏移量
SymbolNode * node = OSAtomicDequeue(&symboList, offsetof(SymbolNode, next));
if (node == NULL) break;
Dl_info info;
dladdr(node->pc, &info);
NSString * name = @(info.dli_sname);
// 添加 _
BOOL isObjc = [name hasPrefix:@"+["] || [name hasPrefix:@"-["];
NSString * symbolName = isObjc ? name : [@"_" stringByAppendingString:name];
//去重
if (![symbolNames containsObject:symbolName]) {
[symbolNames addObject:symbolName];
}
}
//取反
NSArray * symbolAry = [[symbolNames reverseObjectEnumerator] allObjects];
NSLog(@"%@",symbolAry);
//將結果寫入到文件
NSString * funcString = [symbolAry componentsJoinedByString:@"\n"];
NSString * filePath = [NSTemporaryDirectory() stringByAppendingPathComponent:@"linkSymbols.order"];
NSData * fileContents = [funcString dataUsingEncoding:NSUTF8StringEncoding];
BOOL result = [[NSFileManager defaultManager] createFileAtPath:filePath contents:fileContents attributes:nil];
if (result) {
NSLog(@"linkSymbol result %@",filePath);
}else{
NSLog(@"linkSymbol result文件寫入出錯");
}
}
複製代碼
因爲咱們的工程爲pod工程,若是隻在主工程裏添加other c flags只能獲取到主工程層下的全部啓動函數,若是要獲取全部的包含依賴pod中啓動函數符號則須要在每個pod target設置other c flags參數。
咱們能夠經過添加pod腳原本對每個target添加other c flags參數。
在podfile最後添加腳原本爲每個target添加編譯參數。注意能夠過濾掉Debug環境才加載的庫。
post_install do |installer|
pods_project = installer.pods_project
build_settings = Hash[
'OTHER_CFLAGS' => '-fsanitize-coverage=func,trace-pc-guard'
# ,'OTHER_SWIFT_FLAGS' => '-sanitize=undefined -sanitize-coverage=func'
]
pods_project.targets.each do |target|
# if !target.name.include?('Pods-')
if !target.name.include?('Pods-') and target.name != 'LookinServer' and target.name != 'DoraemonKit' and target.name != 'DoraemonKit-DoraemonKit'
# 修改build_settings
target.build_configurations.each do |config|
build_settings.each do |pair|
key = pair[0]
value = pair[1]
if config.build_settings[key].nil?
config.build_settings[key] = ['']
end
if !config.build_settings[key].include?(value)
config.build_settings[key] << value
end
end
end
puts '[Other C Flags]: ' + target.name + ' success.'
end
end
end
複製代碼
從新install以後全部的pod target都會添加上other c flags參數。而後就能夠獲取到全部的函數符號(注意若是是二進制庫則仍是會獲取不到)。
經過objc的源碼能夠看到objc也是經過設置order file設置編譯順序的。
咱們能夠在主工程的Target -> Build Setting -> Linking -> Order File
添加上述步驟導出的函數符號列表linkSymbols.order。
$(SRCROOT)/linkSymbols.order
這裏能夠根據根目錄路徑而後尋找,沒必要把orderfile添加到工程bundle裏。若是添加到工程裏則會被打包到ipa裏。咱們能夠只是放在工程文件夾下,只在編譯的時候根據路徑引用就能夠了。
設置完orderfile以後咱們能夠經過設置write link map file屬性爲YES來找到編譯時生成的符號($Project)-LinkMap-normal-arm64.txt
。 修改完畢後 clean 一下 , 運行工程 , Products - show in finder, 找到 macho 的上上層目錄。 找到結尾爲arm64.txt的文件並打開。
Intermediates -> project_ios.build -> Debug-iphoneos -> project_ios.build -> project_ios-LinkMap-normal-arm64.txt
($Project)-LinkMap-normal-arm64.txt
文件裏在#Symbols
以後爲函數符號連接的順序,能夠驗證一下重排是否成功。
最後能夠看一下咱們重排以後的效果,Instruments下System Trace下Page Fault的次數和耗時:
最後在看一下本次優化的效果。圖中爲iPhone6s Plus重啓後第一次啓動的優化先後截屏。
參考文章: