代碼優化細節

代碼優化細節html

(1)儘可能指定類、方法的final修飾符java

帶有final修飾符的類是不可派生的。在Java核心API中,有許多應用final的例子,例如java.lang.String,整個類都是final的。爲類指定final修飾符可讓類不能夠被繼承,爲方法指定final修飾符可讓方法不能夠被重寫。若是指定了一個類爲final,則該類全部的方法都是final的。Java編譯器會尋找機會內聯全部的final方法,內聯對於提高Java運行效率做用重大,具體參見Java運行期優化。此舉可以使性能平均提升50%。程序員

 

(2)儘可能重用對象算法

特別是String對象的使用,出現字符串鏈接時應該使用StringBuilder/StringBuffer代替。因爲Java虛擬機不只要花時間生成對象,之後可能還須要花時間對這些對象進行垃圾回收和處理,所以,生成過多的對象將會給程序的性能帶來很大的影響。數據庫

 

(3)儘量使用局部變量編程

調用方法時傳遞的參數以及在調用中建立的臨時變量都保存在棧中,速度較快,其餘變量,如靜態變量、實例變量等,都在堆中建立,速度較慢。另外,棧中建立的變量,隨着方法的運行結束,這些內容就沒了,不須要額外的垃圾回收。數組

 

(4)及時關閉流安全

Java編程過程當中,進行數據庫鏈接、I/O流操做時務必當心,在使用完畢後,及時關閉以釋放資源。由於對這些大對象的操做會形成系統大的開銷,稍有不慎,將會致使嚴重的後果。服務器

 

(5)儘可能減小對變量的重複計算多線程

明確一個概念,對方法的調用,即便方法中只有一句語句,也是有消耗的,包括建立棧幀、調用方法時保護現場、調用方法完畢時恢復現場等。因此例以下面的操做:

for (int i = 0; i < list.size(); i++)
{...}

建議替換爲:

for (int i = 0, length = list.size(); i < length; i++)
{...}

這樣,在list.size()很大的時候,就減小了不少的消耗

 

(6)儘可能採用懶加載的策略,即在須要的時候才建立

例如:

String str = "aaa";
if (i == 1)
{
  list.add(str);
}

建議替換爲:

if (i == 1)
{
  String str = "aaa";
  list.add(str);
}

 

(7)慎用異常

異常對性能不利。拋出異常首先要建立一個新的對象,Throwable接口的構造函數調用名爲fillInStackTrace()的本地同步方法,fillInStackTrace()方法檢查堆棧,收集調用跟蹤信息。只要有異常被拋出,Java虛擬機就必須調整調用堆棧,由於在處理過程當中建立了一個新的對象。異常只能用於錯誤處理,不該該用來控制程序流程。

 

(8)不要在循環中使用try...catch...,應該把其放在最外層

根據網友們提出的意見,這一點我認爲值得商榷

 

(9)若是能估計到待添加的內容長度,爲底層以數組方式實現的集合、工具類指定初始長度

好比ArrayList、LinkedLlist、StringBuilder、StringBuffer、HashMap、HashSet等等,以StringBuilder爲例:

  • StringBuilder()      // 默認分配16個字符的空間
  • StringBuilder(int size)  // 默認分配size個字符的空間
  • StringBuilder(String str) // 默認分配16個字符+str.length()個字符空間

能夠經過類(這裏指的不只僅是上面的StringBuilder)的構造函數來設定它的初始化容量,這樣能夠明顯地提高性能。好比StringBuilder吧,length表示當前的StringBuilder能保持的字符數量。由於當StringBuilder達到最大容量的時候,它會將自身容量增長到當前的2倍再加2,不管什麼時候只要StringBuilder達到它的最大容量,它就不得不建立一個新的字符數組而後將舊的字符數組內容拷貝到新字符數組中----這是十分耗費性能的一個操做。試想,若是能預估到字符數組中大概要存放5000個字符而不指定長度,最接近5000的2次冪是4096,每次擴容加的2無論,那麼:

  • 在4096 的基礎上,再申請8194個大小的字符數組,加起來至關於一次申請了12290個大小的字符數組,若是一開始能指定5000個大小的字符數組,就節省了一倍以上的空間
  • 把原來的4096個字符拷貝到新的的字符數組中去

這樣,既浪費內存空間又下降代碼運行效率。因此,給底層以數組實現的集合、工具類設置一個合理的初始化容量是錯不了的,這會帶來立竿見影的效果。可是,注意,像HashMap這種是以數組+鏈表實現的集合,別把初始大小和你估計的大小設置得同樣,由於一個table上只鏈接一個對象的可能性幾乎爲0。初始大小建議設置爲2的N次冪,若是能估計到有2000個元素,設置成new HashMap(128)、new HashMap(256)均可以。

 

(10)當複製大量數據時,使用System.arraycopy()命令

 

(11)乘法和除法使用移位操做

例如:

for (val = 0; val < 100000; val += 5)
{
  a = val * 8;
  b = val / 2;
}

用移位操做能夠極大地提升性能,由於在計算機底層,對位的操做是最方便、最快的,所以建議修改成: 

for (val = 0; val < 100000; val += 5)
{
  a = val << 3;
  b = val >> 1;
}

移位操做雖然快,可是可能會使代碼不太好理解,所以最好加上相應的註釋。

 

(12)循環內不要不斷建立對象引用

例如:

for (int i = 1; i <= count; i++)
{
    Object obj = new Object();    
}

這種作法會致使內存中有count份Object對象引用存在,count很大的話,就耗費內存了,建議爲改成:

Object obj = null;
for (int i = 0; i <= count; i++)
{
    obj = new Object();
}

這樣的話,內存中只有一份Object對象引用,每次new Object()的時候,Object對象引用指向不一樣的Object罷了,可是內存中只有一份,這樣就大大節省了內存空間了。

 

(13)基於效率和類型檢查的考慮,應該儘量使用array,沒法肯定數組大小時才使用ArrayList

 

(14)儘可能使用HashMap、ArrayList、StringBuilder,除非線程安全須要,不然不推薦使用Hashtable、Vector、StringBuffer,後三者因爲使用同步機制而致使了性能開銷

 

(15)不要將數組聲明爲public static final

由於這毫無心義,這樣只是定義了引用爲static final,數組的內容仍是能夠隨意改變的,將數組聲明爲public更是一個安全漏洞,這意味着這個數組能夠被外部類所改變

 

(16)儘可能在合適的場合使用單例

使用單例能夠減輕加載的負擔、縮短加載的時間、提升加載的效率,但並非全部地方都適用於單例,簡單來講,單例主要適用於如下三個方面:

  • 控制資源的使用,經過線程同步來控制資源的併發訪問
  • 控制實例的產生,以達到節約資源的目的
  • 控制數據的共享,在不創建直接關聯的條件下,讓多個不相關的進程或線程之間實現通訊

 

(17)儘可能避免隨意使用靜態變量

要知道,當某個對象被定義爲static的變量所引用,那麼gc一般是不會回收這個對象所佔有的堆內存的,如:

public class A
{
    private static B b = new B();  
}

此時靜態變量b的生命週期與A類相同,若是A類不被卸載,那麼引用B指向的B對象會常駐內存,直到程序終止

 

(18)及時清除再也不須要的會話

爲了清除再也不活動的會話,許多應用服務器都有默認的會話超時時間,通常爲30分鐘。當應用服務器須要保存更多的會話時,若是內存不足,那麼操做系統會把部分數據轉移到磁盤,應用服務器也可能根據MRU(最近最頻繁使用)算法把部分不活躍的會話轉儲到磁盤,甚至可能拋出內存不足的異常。若是會話要被轉儲到磁盤,那麼必需要先被序列化,在大規模集羣中,對對象進行序列化的代價是很昂貴的。所以,當會話再也不須要時,應當及時調用HttpSession的invalidate()方法清除會話。

 

(19)實現RandomAccess接口的集合好比ArrayList,應當使用最普通的for循環而不是foreach循環來遍歷

這是JDK推薦給用戶的。JDK API對於RandomAccess接口的解釋是:實現RandomAccess接口用來代表其支持快速隨機訪問,此接口的主要目的是容許通常的算法更改其行爲,從而將其應用到隨機或連續訪問列表時能提供良好的性能。實際經驗代表,實現RandomAccess接口的類實例,假如是隨機訪問的,使用普通for循環效率將高於使用foreach循環;反過來,若是是順序訪問的,則使用Iterator會效率更高。可使用相似以下的代碼做判斷:

複製代碼
if (list instanceof RandomAccess)
{
    for (int i = 0; i < list.size(); i++){}
}
else
{
    Iterator<?> iterator = list.iterable();
    while (iterator.hasNext()){iterator.next()}
}
複製代碼

foreach循環的底層實現原理就是迭代器Iterator,參見Java語法糖1:可變長度參數以及foreach循環原理。因此後半句"反過來,若是是順序訪問的,則使用Iterator會效率更高"的意思就是順序訪問的那些類實例,使用foreach循環去遍歷。

 

(20)使用同步代碼塊替代同步方法

這點在多線程模塊中的synchronized鎖方法塊一文中已經講得很清楚了,除非能肯定一整個方法都是須要進行同步的,不然儘可能使用同步代碼塊,避免對那些不須要進行同步的代碼也進行了同步,影響了代碼執行效率。

 

(21)將常量聲明爲static final,並以大寫命名

這樣在編譯期間就能夠把這些內容放入常量池中,避免運行期間計算生成常量的值。另外,將常量的名字以大寫命名也能夠方便區分出常量與變量

 

(22)不要建立一些不使用的對象,不要導入一些不使用的類

這毫無心義,若是代碼中出現"The value of the local variable i is not used"、"The import java.util is never used",那麼請刪除這些無用的內容

 

(23)程序運行過程當中避免使用反射

關於,請參見反射。反射是Java提供給用戶一個很強大的功能,功能強大每每意味着效率不高。不建議在程序運行過程當中使用尤爲是頻繁使用反射機制,特別是Method的invoke方法,若是確實有必要,一種建議性的作法是將那些須要經過反射加載的類在項目啓動的時候經過反射實例化出一個對象並放入內存----用戶只關心和對端交互的時候獲取最快的響應速度,並不關心對端的項目啓動花多久時間。

 

(24)使用數據庫鏈接池和線程池

這兩個池都是用於重用對象的,前者能夠避免頻繁地打開和關閉鏈接,後者能夠避免頻繁地建立和銷燬線程

 

(25)使用帶緩衝的輸入輸出流進行IO操做

帶緩衝的輸入輸出流,即BufferedReader、BufferedWriter、BufferedInputStream、BufferedOutputStream,這能夠極大地提高IO效率

 

(26)順序插入和隨機訪問比較多的場景使用ArrayList,元素刪除和中間插入比較多的場景使用LinkedList

這個,理解ArrayList和LinkedList的原理就知道了

 

(27)不要讓public方法中有太多的形參

public方法即對外提供的方法,若是給這些方法太多形參的話主要有兩點壞處:

  • 違反了面向對象的編程思想,Java講求一切都是對象,太多的形參,和麪向對象的編程思想並不契合
  • 參數太多勢必致使方法調用的出錯機率增長

至於這個"太多"指的是多少個,三、4個吧。好比咱們用JDBC寫一個insertStudentInfo方法,有10個學生信息字段要插如Student表中,能夠把這10個參數封裝在一個實體類中,做爲insert方法的形參

 

(28)字符串變量和字符串常量equals的時候將字符串常量寫在前面

這是一個比較常見的小技巧了,若是有如下代碼:

String str = "123";
if (str.equals("123"))
{
...
}

建議修改成:

String str = "123";
if ("123".equals(str))
{
    ...
}

這麼作主要是能夠避免空指針異常

 

(29)請知道,在java中if (i == 1)和if (1 == i)是沒有區別的,但從閱讀習慣上講,建議使用前者

平時有人問,"if (i == 1)"和"if (1== i)"有沒有區別,這就要從C/C++講起。

在C/C++中,"if (i == 1)"判斷條件成立,是以0與非0爲基準的,0表示false,非0表示true,若是有這麼一段代碼:

複製代碼
int i = 2;
if (i == 1)
{
    ...
}
else
{
    ...
}
複製代碼

C/C++判斷"i==1"不成立,因此以0表示,即false。可是若是:

複製代碼
int i = 2;
if (i = 1)
{
    ...
}
else
{
    ...
}
複製代碼

萬一程序員一個不當心,把"if (i == 1)"寫成"if (i = 1)",這樣就有問題了。在if以內將i賦值爲1,if判斷裏面的內容非0,返回的就是true了,可是明明i爲2,比較的值是1,應該返回的false。這種狀況在C/C++的開發中是極可能發生的而且會致使一些難以理解的錯誤產生,因此,爲了不開發者在if語句中不正確的賦值操做,建議將if語句寫爲:

複製代碼
int i = 2;
if (1 == i)
{
    ...
}
else
{
    ...
}
複製代碼

這樣,即便開發者不當心寫成了"1 = i",C/C++編譯器也能夠第一時間檢查出來,由於咱們能夠對一個變量賦值i爲1,可是不能對一個常量賦值1爲i。

可是,在Java中,C/C++這種"if (i = 1)"的語法是不可能出現的,由於一旦寫了這種語法,Java就會編譯報錯"Type mismatch: cannot convert from int to boolean"。可是,儘管Java的"if (i == 1)"和"if (1 == i)"在語義上沒有任何區別,從閱讀習慣上講,建議使用前者會更好些。

 

(30)不要對數組使用toString()方法

看一下對數組使用toString()打印出來的是什麼:

public static void main(String[] args)
{
    int[] is = new int[]{1, 2, 3};
    System.out.println(is.toString());
}

結果是:

[I@18a992f

本意是想打印出數組內容,卻有可能由於數組引用is爲空而致使空指針異常。不過雖然對數組toString()沒有意義,可是對集合toString()是能夠打印出集合裏面的內容的,由於集合的父類AbstractCollections<E>重寫了Object的toString()方法。

 

(31)不要對超出範圍的基本數據類型作向下強制轉型

這毫不會獲得想要的結果:

public static void main(String[] args)
{
    long l = 12345678901234L;
    int i = (int)l;
    System.out.println(i);
}

咱們可能指望獲得其中的某幾位,可是結果倒是:

1942892530

解釋一下。Java中long是8個字節64位的,因此12345678901234在計算機中的表示應該是:

0000 0000 0000 0000 0000 1011 0011 1010 0111 0011 1100 1110 0010 1111 1111 0010

一個int型數據是4個字節32位的,從低位取出上面這串二進制數據的前32位是:

0111 0011 1100 1110 0010 1111 1111 0010

這串二進制表示爲十進制1942892530,因此就是咱們上面的控制檯上輸出的內容。從這個例子上還能順便獲得兩個結論:

一、整型默認的數據類型是int,long l = 12345678901234L,這個數字已經超出了int的範圍了,因此最後有一個L,表示這是一個long型數。順便,浮點型的默認類型是double,因此定義float的時候要寫成""float f = 3.5f"

二、接下來再寫一句"int ii = l + i;"會報錯,由於long + int是一個long,不能賦值給int

 

(32)公用的集合類中不使用的數據必定要及時remove掉

若是一個集合類是公用的(也就是說不是方法裏面的屬性),那麼這個集合裏面的元素是不會自動釋放的,由於始終有引用指向它們。因此,若是公用集合裏面的某些數據不使用而不去remove掉它們,那麼將會形成這個公用集合不斷增大,使得系統有內存泄露的隱患。

 

(33)把一個基本數據類型轉爲字符串,基本數據類型.toString()是最快的方式、String.valueOf(數據)次之、數據+""最慢

把一個基本數據類型轉爲通常有三種方式,我有一個Integer型數據i,可使用i.toString()、String.valueOf(i)、i+""三種方式,三種方式的效率如何,看一個測試:

複製代碼
public static void main(String[] args)
{
    int loopTime = 50000;
    Integer i = 0;
    long startTime = System.currentTimeMillis();
    for (int j = 0; j < loopTime; j++)
    {
        String str = String.valueOf(i);
    }    
    System.out.println("String.valueOf():" + (System.currentTimeMillis() - startTime) + "ms");
    startTime = System.currentTimeMillis();
    for (int j = 0; j < loopTime; j++)
    {
        String str = i.toString();
    }    
    System.out.println("Integer.toString():" + (System.currentTimeMillis() - startTime) + "ms");
    startTime = System.currentTimeMillis();
    for (int j = 0; j < loopTime; j++)
    {
        String str = i + "";
    }    
    System.out.println("i + \"\":" + (System.currentTimeMillis() - startTime) + "ms");
}
複製代碼

運行結果爲:

String.valueOf():11ms
Integer.toString():5ms
i + "":25ms

因此之後遇到把一個基本數據類型轉爲String的時候,優先考慮使用toString()方法。至於爲何,很簡單:

  • String.valueOf()方法底層調用了Integer.toString()方法,可是會在調用前作空判斷
  • Integer.toString()方法就不說了,直接調用了
  • i + ""底層使用了StringBuilder實現,先用append方法拼接,再用toString()方法獲取字符串

三者對比下來,明顯是2最快、1次之、3最慢

(34)使用最有效率的方式去遍歷Map

遍歷Map的方式有不少,一般場景下咱們須要的是遍歷Map中的Key和Value,那麼推薦使用的、效率最高的方式是:

複製代碼
public static void main(String[] args)
{
    HashMap<String, String> hm = new HashMap<String, String>();
    hm.put("111", "222");
        
    Set<Map.Entry<String, String>> entrySet = hm.entrySet();
    Iterator<Map.Entry<String, String>> iter = entrySet.iterator();
    while (iter.hasNext())
    {
        Map.Entry<String, String> entry = iter.next();
        System.out.println(entry.getKey() + "\t" + entry.getValue());
    }
}
複製代碼

若是你只是想遍歷一下這個Map的key值,那用"Set<String> keySet = hm.keySet();"會比較合適一些

 

(35)對資源的close()建議分開操做

意思是,好比我有這麼一段代碼:

複製代碼
try
{
    XXX.close();
    YYY.close();
}
catch (Exception e)
{
    ...
}
複製代碼

建議修改成:

複製代碼
try
{
    XXX.close();
}
catch (Exception e)
{
    ...
}
try
{
    YYY.close();
}
catch (Exception e)
{
    ...
}
複製代碼

雖然有些麻煩,卻能避免資源泄露。咱們想,若是沒有修改過的代碼,萬一XXX.close()拋異常了,那麼就進入了catch塊中了,YYY.close()不會執行,YYY這塊資源就不會回收了,一直佔用着,這樣的代碼一多,是可能引發資源句柄泄露的。而改成下面的寫法以後,就保證了不管如何XXX和YYY都會被close掉

 

(36)對於ThreadLocal使用前或者使用後必定要先remove

當前基本全部的項目都使用了線程池技術,這很是好,能夠動態配置線程數、能夠重用線程。

然而,若是你在項目中使用到了ThreadLocal,必定要記得使用前或者使用後remove一下。這是由於上面提到了線程池技術作的是一個線程重用,這意味着代碼運行過程當中,一條線程使用完畢,並不會被銷燬而是等待下一次的使用。咱們看一下Thread類中,持有ThreadLocal.ThreadLocalMap的引用:

/* ThreadLocal values pertaining to this thread. This map is maintained
 * by the ThreadLocal class. */
ThreadLocal.ThreadLocalMap threadLocals = null;

線程不銷燬意味着上條線程set的ThreadLocal.ThreadLocalMap中的數據依然存在,那麼在下一條線程重用這個Thread的時候,極可能get到的是上條線程set的數據而不是本身想要的內容。

這個問題很是隱晦,一旦出現這個緣由致使的錯誤,沒有相關經驗或者沒有紮實的基礎很是難發現這個問題,所以在寫代碼的時候就要注意這一點,這將給你後續減小不少的工做量。

 

(37)切記以常量定義的方式替代魔鬼數字,魔鬼數字的存在將極大地下降代碼可讀性,字符串常量是否使用常量定義能夠視狀況而定

 

(38)long或者Long初始賦值時,使用大寫的L而不是小寫的l,由於字母l極易與數字1混淆,這個點很是細節,值得注意

 

(39)全部重寫的方法必須保留@Override註解

這麼作有三個緣由:

(1)清楚地能夠知道這個方法由父類繼承而來

(2)getObject()和get0bject()方法,前者第四個字母是"O",後者第四個子母是"0",加了@Override註解能夠立刻判斷是否重寫成功

(3)在抽象類中對方法簽名進行修改,實現類會立刻報出編譯錯誤

 

(40)推薦使用JDK7中新引入的Objects工具類來進行對象的equals比較,直接a.equals(b),有空指針異常的風險

 

(41)循環體內不要使用"+"進行字符串拼接,而直接使用StringBuilder不斷append

說一下不使用"+"進行字符串拼接的緣由,假如我有一個方法:

複製代碼
public String appendStr(String oriStr, String... appendStrs) {
    if (appendStrs == null || appendStrs.length == 0) {
        return oriStr;
    }
        
    for (String appendStr : appendStrs) {
        oriStr += appendStr;
    }
        
    return oriStr;
}
複製代碼

將這段代碼編譯以後的.class文件,使用javap -c進行反編譯一下,截取關鍵的一部分:

意思就是每次虛擬機碰到"+"這個操做符對字符串進行拼接的時候,會new出一個StringBuilder,而後調用append方法,最後調用toString()方法轉換字符串賦值給oriStr對象,即循環多少次,就會new出多少個StringBuilder()來,這對於內存是一種浪費。

 

(42)不捕獲Java類庫中定義的繼承自RuntimeException的運行時異常類

異常處理效率低,RuntimeException的運行時異常類,其中絕大多數徹底能夠由程序員來規避,好比:

  • ArithmeticException能夠經過判斷除數是否爲空來規避
  • NullPointerException能夠經過判斷對象是否爲空來規避
  • IndexOutOfBoundsException能夠經過判斷數組/字符串長度來規避
  • ClassCastException能夠經過instanceof關鍵字來規避
  • ConcurrentModificationException可使用迭代器來規避

 

(43)避免Random實例被多線程使用,雖然共享該實例是線程安全的,但會因競爭同一seed 致使的性能降低,JDK7以後,可使用ThreadLocalRandom來獲取隨機數

解釋一下競爭同一個seed致使性能降低的緣由,好比,看一下Random類的nextInt()方法實現:

 1 public int nextInt() {
 2     return next(32);
 3 }

調用了next(int bits)方法,這是一個受保護的方法:

複製代碼
1 protected int next(int bits) {
2     long oldseed, nextseed;
3     AtomicLong seed = this.seed;
4     do {
5         oldseed = seed.get();
6         nextseed = (oldseed * multiplier + addend) & mask;
7     } while (!seed.compareAndSet(oldseed, nextseed));
8     return (int)(nextseed >>> (48 - bits));
9 }
複製代碼

而這邊的seed是一個全局變量:

1 /**
2  * The internal state associated with this pseudorandom number generator.
3  * (The specs for the methods in this class describe the ongoing
4  * computation of this value.)
5  */
6 private final AtomicLong seed;

多個線程同時獲取隨機數的時候,會競爭同一個seed,致使了效率的下降。

 

(44)靜態類、單例類、工廠類將它們的構造函數置爲private

這是由於靜態類、單例類、工廠類這種類原本咱們就不須要外部將它們new出來,將構造函數置爲private以後,保證了這些類不會產生實例對象。

相關文章
相關標籤/搜索