引言java
都說 StringBuilder 在處理字符串拼接上效率要強於 String,但有時候咱們的理解可能會存在必定的誤差。最近我在測試數據導入效率的時候就發現我之前對 StringBuilder 的部分理解是錯誤的。後來我經過實踐測試 + 找原理 的方式搞清楚了這塊的邏輯。如今將過程分享給你們微信
測試用例app
咱們的代碼在循環中拼接字符串通常有兩種狀況機器學習
- 第一種就是每次循環將對象中的幾個字段拼接成一個新字段,再賦值給對象
- 第二種操做是在循環外建立一個字符串對象,每次循環向該字符串拼接新的內容。循環結束後獲得拼接好的字符串
對於這兩種狀況,我建立了兩個對照組ide
第一組:學習
在每次 For 循環中拼接字符串,即拼即用、用完即毀。分別使用 String 和 StringBuilder 拼接測試
/** * 循環內 String 拼接字符串,一次循環後銷燬 */ public static void useString(){ for (int i = 0; i < CYCLE_NUM_BIGGER; i++) { String str = str1 + i + str2 + i + str3 + i + str4 ; } } /** * 循環內 使用 StringBuilder 拼接字符串,一次循環後銷燬 */ public static void useStringBuilder(){ for (int i = 0; i < CYCLE_NUM_BIGGER; i++) { StringBuilder sb = new StringBuilder(); String s = sb.append(str1).append(i).append(str2).append(i).append(str3).append(i).append(str4).toString(); } }
第二組:大數據
屢次 For 循環拼接一個字符串,循環結束後使用字符串,使用後由垃圾回收器回收。也是分別使用 String 和 StringBuilder 拼接優化
/** * 屢次循環拼接成一個字符串 用 String */ public static void useStringSpliceOneStr (){ String str = ""; for (int i = 0; i < CYCLE_NUM_LOWER; i++) { str += str1 + str2 + str3 + str4 + i; } } /** * 屢次循環拼接成一個字符串 用 StringBuilder */ public static void useStringBuilderSpliceOneStr(){ StringBuilder sb = new StringBuilder(); for (int i = 0; i < CYCLE_NUM_LOWER; i++) { sb.append(str1).append(str2).append(str3).append(str4).append(i); } }
爲了保證測試質量,在每一個測試項目進行前。線程休息 2s,以後空跑 5 次熱身。最後執行 5 次求平均時間的方式計算時間ui
public static int executeSometime(int kind, int num) throws InterruptedException { Thread.sleep(2000); int sum = 0; for (int i = 0; i < num + 5; i++) { long begin = System.currentTimeMillis(); switch (kind){ case 1: useString(); break; case 2: useStringBuilder(); break; case 3: useStringSpliceOneStr(); break; case 4: useStringBuilderSpliceOneStr(); break; default: return 0; } long end = System.currentTimeMillis(); if(i > 5){ sum += (end - begin); } } return sum / num; }
主方法
public class StringTest { public static final int CYCLE_NUM_BIGGER = 10_000_000; public static final int CYCLE_NUM_LOWER = 10_000; public static final String str1 = "張三"; public static final String str2 = "李四"; public static final String str3 = "王五"; public static final String str4 = "趙六"; public static void main(String[] args) throws InterruptedException { int time = 0; int num = 5; time = executeSometime(1, num); System.out.println("String拼接 "+ CYCLE_NUM_BIGGER +" 次," + num + "次平均時間:" + time + " ms"); time = executeSometime(2, num); System.out.println("StringBuilder拼接 "+ CYCLE_NUM_BIGGER +" 次," + num + "次平均時間:" + time + " ms"); time = executeSometime(3, num); System.out.println("String拼接單個字符串 "+ CYCLE_NUM_LOWER +" 次," + num + "次平均時間:" + time + " ms"); time = executeSometime(4, num); System.out.println("StringBuilder拼接單個字符串 "+ CYCLE_NUM_LOWER +" 次," + num + "次平均時間:" + time + " ms"); } }
測試結果
測試結果以下: 結果分析
第一組 10_000_000 次循環拼接,在循環內使用 String 和 StringBuilder 的效率是同樣的!爲何呢?
使用 javap -c StringTest.class 反編譯查看兩個方法編譯後的文件: 能夠發現 String 方法拼接字符串編譯器優化後使用的就是 StringBuilder、所以用例1 和用例2 的效率是同樣的。
第二組 第二組的結果就是你們喜聞樂見的了,因爲 10_000_000 次循環String 拼接實在太慢因此我採用了 10_000 次拼接來分析。
分析用例3:雖然編譯器會對 String 拼接作優化,可是它每次在循環內建立 StringBuilder 對象,在循環內銷燬。下次循環他有建立。相比較用例4在循環外建立,多了 n 次 new 對象、銷燬對象的操做、n - 1 次將 StringBuilder 轉換成 String 的操做 。效率低也是理所應當了。
擴展 第一組的測試還有一種寫法:
/** * 循環內 使用 StringBuilder 拼接字符串,一次循環後銷燬 */ public static void useStringBuilderOut(){ StringBuilder sb = new StringBuilder(); for (int i = 0; i < CYCLE_NUM_BIGGER; i++) { // sb.setLength(0); sb.delete(0, sb.length()); String s = sb.append(str1).append(i).append(str2).append(i).append(str3).append(i).append(str4).toString(); } }
循環外建立 StringBuilder 每次循環開始的時候清空 StringBuilder 的內容而後拼接。這種寫法不管使用 sb.setLength(0); 仍是 sb.delete(0, sb.length()); 效率都比直接在循環內使用 String / StringBuilder 慢。奈何才疏學淺我一直想不明白爲何他慢。我猜想是 new 對象的速度比重置長度慢,因而這樣測試瞭如下:
public static void createStringBuider() { for (int i = 0; i < CYCLE_NUM_BIGGER; i++) { StringBuilder sb = new StringBuilder(); } } public static void cleanStringBuider() { StringBuilder sb = new StringBuilder(); for (int i = 0; i < CYCLE_NUM_BIGGER; i++) { sb.delete(0, sb.length()); } }
可是結果是 cleanStringBuider 更快。讓我摸不着頭腦
若是有大神看到但願能夠幫忙分析分析
結論
- 編譯器會將 String 拼接優化成使用 StringBuilder,可是仍是有一些缺陷的。主要體如今循環內使用字符串拼接,編譯器不會建立單個 StringBuilder 以複用
- 對於屢次循環內拼接一個字符串的需求:StringBuilder 很快,由於其避免了 n 次 new 對象、銷燬對象的操做,n - 1 次將 StringBuilder 轉換成 String 的操做
- StringBuilder 拼接不適用於循環內每次拼接即用的操做方式。由於編譯器優化後的 String 拼接也是使用 StringBuilder 二者的效率同樣。後者寫起來還方便...
歡迎關注個人微信公衆號「碼農突圍」,分享Python、Java、大數據、機器學習、人工智能等技術,關注碼農技術提高•職場突圍•思惟躍遷,20萬+碼農成長充電第一站,陪有夢想的你一塊兒成長