Android App 性能優化

性能優化 算法

Android應用程序運行的移動設備受限於其運算能力,存儲空間,及電池續航。由此,它必須是高效的。電池續航多是一個促使你優化程序的緣由,即便他看起來已經運行的足夠快了。因爲續航對用戶的重要性,當電量耗損陡增時,意味這用戶早晚會發現是因爲你的程序。 數組

雖然這份文檔主要包含着細微的優化,但這些毫不能成爲你軟件成敗的關鍵。選擇合適的算法和數據結構永遠是你最早應該考慮的事情,但這超出這份文檔以外。 緩存

 

簡介 性能優化

寫出高效的代碼有兩條基本的原則: 數據結構

l  不做沒有必要的工做。 架構

l  儘可能避免內存分配。 併發

 

明智的優化 框架

這份文檔是關於Android規範的細微優化,因此先確保你已經瞭解哪些代碼須要優化,而且知道如何去衡量你所作修改所帶來的效果(好或壞)。開發投入的時間是有限的,因此明智的時間規劃很重要。 數據結構和算法

(更多分析和筆記參見總結。) svn

這份文檔同時確保你在算法和數據結構上做出最佳選擇的同時,考慮API選擇所帶來的潛在影響。使用合適的數據結構和算法比這裏的任何建議都更有價值,優先考慮API版本帶來的影響有助於你找到更好的實現。(這在類庫代碼中更爲重要,相比應用代碼)

(若是你須要這樣的建議,參見 Josh Bloch's Effective Java, item 47.)

在優化Android程序時,會遇到的一個棘手問題是,保證你的程序能在不一樣的硬件平臺上運行。虛擬機版本和處理器各部相同,所以運行在之上的速度也大不同。但這而且不是簡單的AB快或慢,並能在設備間作出排列。特別的,模擬器上只能評測出一小部分設備上體現的東西。有無JIT的設備間也存在着巨大差別,在JIT設備上好的代碼有時候會在無JIT的設備上表現的並很差。

若是你想知道一個程序在設備上的具體表現,就必須在上面進行測試。

 

避免建立沒必要要的對象

對象建立永遠不會是免費的。每一個線程的分代GC給零時對象分配一個地址池以下降分配開銷,但每每內存分配比不分配須要的代價大。

若是在用戶界面週期內分配對象,就會強制一個週期性的垃圾回收,給用戶體驗增長小小的停頓間隙。Gingerbread中提到的併發回收也許有用,但沒必要要的工做應當被避免的。

所以,應該避免沒必要要的對象建立。下面是幾個例子:

l  若是有一個返回String的方法,而且他的返回值經常附加在一個StringBuffer上,改變聲明和實現,讓函數直接在其後面附加,而非建立一個短暫存在的零時變量。

l  當從輸入的數據集合中讀取數據時,考慮返回原始數據的子串,而非新建一個拷貝.這樣你雖然建立一個新的對象,可是他們共享該數據的char數組。(結果是即便僅僅使用原始輸入的一部分,你也須要保證它的總體一直存在於內存中。)

一個更完全的方案是將多維數組切割成平行一維數組:

l  Int類型的數組常有餘Integer類型的。推而廣之,兩個平行的int數組要比一個(int,int)型的對象數組高效。這對於其餘任何基本數據類型的組合都通用。

l  若是須要實現一個容器來存放元組(Foo,Bar),兩個平行數組Foo[],Bar[]會優於一個(Foo,Bar)對象的數組。(例外狀況是:當你設計API給其餘代碼調用時,應用好的API設計來換取小的速度提高。但在本身的內部代碼中,儘可能嘗試高效的實現。)

一般來說,儘可能避免建立短時零時對象.少的對象建立意味着低頻的垃圾回收。而這對於用戶體驗產生直接的影響。

 

性能之謎

前一個版本的文檔給出了好多誤導人的主張,這裏作一些澄清:

在沒有JIT的設備上,調用方法所傳遞的對象採用具體的類型而非接口類型會更高效(好比,傳遞HashMap mapMap map調用一個方法的開銷小,儘管兩個map都是HashMap.但這並非兩倍慢的情形,事實上,他們只相差6%,而有JIT時這兩種調用的效率不相上下。

在沒有JIT的設備上,緩存後的字段訪問比直接訪問快大概20%。而在有JIT的狀況下,字段訪問的代價等同於局部訪問,所以這裏不值得優化,除非你以爲他會讓你的代碼更易讀(對於final ,static,及static final 變量一樣適用)

 

用靜態代替虛擬

         若是不須要訪問某對象的字段,將方法設置爲靜態,調用會加速15%20%。這也是一種好的作法,由於你能夠從方法聲明中看出調用該方法不須要更新此對象的狀態。

 

避免內部的Getters/Setters

在源生語言像C++中,一般作法是用Gettersi=getCount())代替直接字段訪問(i=mCount)。這是C++中一個好的習慣,由於編譯器會內聯這些訪問,而且若是須要約束或者調試這些域的訪問,你能夠在任什麼時候間添加代碼。

而在Android中,這不是一個好的作法。虛方法調用的代價比直接字段訪問高昂許多。一般根據面嚮對象語言的實踐,在公共接口中使用GettersSetters是有道理的,但在一個字段常常被訪問的類中宜採用直接訪問。

JIT時,直接字段訪問大約比調用getter訪問快3倍。有JIT時(直接訪問字段開銷等同於局部變量訪問),要快7倍。在Froyo版本中確實如此,但之後版本可能會在JIT中改進Getter方法的內聯。

 

對常量使用Static Final修飾符

考慮下面類首的聲明:

編譯器會生成一個類初始化方法<clinit>,當該類初次被使用時執行,這個方法將42存入intVal中,並獲得類文件字符串常量strVal的一個引用。當這些值在後面被引用時,他們經過字段查找進行訪問。

咱們改進實現,採用 final關鍵字:

類再也不須要<clinit>方法,由於常量經過靜態字段初始化器進入dex文件中。引用intVal的代碼,將直接調用整形值42;而訪問strVal,也會採用相對開銷較小的字符串常量(原文:「sring constant」)指令替代字段查找。(這種優化僅僅是針對基本數據類型和String類型常量的,而非任意的引用類型。但儘量的將常量聲明爲static final是一種好的作法。

 

使用改進的For循環語法

改進for循環(有時被稱爲「for-each」循環)可以用於實現了iterable接口的集合類及數組中。在集合類中,迭代器讓接口調用hasNext()next()方法。在ArrayList中,手寫的計數循環迭代要快3倍(不管有沒有JIT),但其餘集合類中,改進的for循環語法和迭代器具備相同的效率。

這裏有一些迭代數組的實現:

zero()是當中最慢的,由於對於這個遍歷中的歷次迭代,JIT並不能優化獲取數組長度的開銷。

One()稍快,將全部東西都放進局部變量中,避免了查找。但僅只有聲明數組長度對性能改善有益。

Two()是在無JIT的設備上運行最快的,對於有JIT的設備則和one()不分上下。他採用了JDK1.5中的改進for循環語法。

結論:優先採用改進for循環,但在性能要求苛刻的ArrayList迭代中,考慮採用手寫計數循環。

(參見 Effective Java item 46.)

 

在私有內部內中,考慮用包訪問權限替代私有訪問權限

考慮下面的定義:

須要注意的關鍵是:咱們定義的一個私有內部類(Foo$Inner),直接訪問外部類中的一個私有方法和私有變量。這是合法的,代碼也會打印出預期的「Value is 27」

但問題是,虛擬機認爲從Foo$Inner中直接訪問Foo的私有成員是非法的,由於他們是兩個不一樣的類,儘管Java語言容許內部類訪問外部類的私有成員,可是經過編譯器生成幾個綜合方法來橋接這些間隙的。

內部類會在外部類中任何須要訪問mValue字段或調用doStuff方法的地方調用這些靜態方法。這意味着這些代碼將直接存取成員變量表現爲經過存取器方法訪問。以前提到過存取器訪問如何比直接訪問慢,這例子說明,某些語言約會定致使不可見的性能問題。

若是你在高性能的Hotspot中使用這些代碼,能夠經過聲明被內部類訪問的字段和成員爲包訪問權限,而非私有。但這也意味着這些字段會被其餘處於同一個包中的類訪問,所以在公共API中不宜採用。

 

合理利用浮點數

一般的經驗是,在Android設備中,浮點數會比整型慢兩倍,在缺乏FPUJITG1上對比有FPUJITNexus One中確實如此(兩種設備間算術運算的絕對速度差大約是10倍)

從速度方面說,在現代硬件上,floatdouble之間沒有任何不一樣。更普遍的講,double2倍。在臺式機上,因爲不存在空間問題,double的優先級高於float

但即便是整型,有的芯片擁有硬件乘法,卻缺乏除法。這種狀況下,整型除法和求模運算是經過軟件實現的,就像當你設計Hash表,或是作大量的算術那樣。

 

瞭解並使用類庫

         選擇Library中的代碼而非本身重寫,除了一般的那些緣由外,考慮到系統空閒時會用匯編代碼調用來替代library方法,這可能比JIT中生成的等價的最好的Java代碼還要好。典型的例子就是String.indexOfDalvik用內部內聯來替代。一樣的,System.arraycopy方法在有JITNexus One上,自行編碼的循環快9倍。

         (參見 Effective Java item 47.)

 

合理利用本地方法

本地方法並非必定比Java高效。最起碼,Javanative之間過渡的關聯是有消耗的,而JIT並不能對此進行優化。當你分配本地資源時(本地堆上的內存,文件說明符等),每每很難實時的回收這些資源。同時你也須要在各類結構中編譯你的代碼(而非依賴JIT)。甚至可能須要針對相同的架構來編譯出不一樣的版本:針對ARM處理器的GI編譯的本地代碼,並不能充分利用Nexus One上的ARM,而針對Nexus OneARM編譯的本地代碼不能在G1ARM上運行。

當你想部署程序到存在本地代碼庫的Android平臺上時,本地代碼才顯得尤其有用,而並不是爲了Java應用程序的提速。

(參見 Effective Java item 54.)

 

結語

最後:一般考慮的是:先肯定存在問題,再進行優化。而且你知道當前系統的性能,不然沒法衡量你進行嘗試所獲得的提高。

這份文檔中的每一個主張都有標準基準測試做爲支持。你能夠在code.google.com「dalvik」項目中找到基準測試的代碼。

這個標準基準測試是創建在Caliper Java標準微基準測試框架之上的。標準微基準測試很難找到正確的路,因此Caliper幫你完成了其中的困難部分工做。而且當你會察覺到某些狀況的測試結果並想象中的那樣(虛擬機老是在優化你的代碼的)。咱們強烈推薦你用Caliper來運行你本身的標準微基準測試。

同時你也會發現Traceview對分析頗有用,但必須瞭解,他目前是不不支持JIT的,這可能致使那些在JIT上能夠勝出的代碼運行超時。特別重要的,根據Taceview的數據做出更改後,請確保代碼在沒有Traceview時,確實跑的快了。

相關文章
相關標籤/搜索