Java細節:字符串的拼接

不可變的String對象

在Java中,String對象是不可變的(Immutable)。在代碼中,能夠建立多個某一個String對象的別名。可是這些別名都是的引用是相同的。
好比s1和s2都是」droidyue.com」對象的別名,別名保存着到真實對象的引用。因此s1 = s2java

fileos:falseandroid

1
2
3
String s1 = "droidyue.com";
String s2 = s1;
System.out.println("s1 and s2 has the same reference =" + (s1 == s2));

Java中僅有的重載運算符

在Java中,惟一被重載的運算符就是字符串的拼接相關的。+,+=。除此以外,Java設計者不容許重載其餘的運算符。app

拼接剖析

真的有性能代價麼

瞭解了上面兩點,可能會有這樣的思考,既然Sting對象不可變,那麼多個(三個及以上)字符串拼接必然產生多餘的中間String對象。ide

fileos:falseoop

1
2
3
4
String userName = "Andy";
String age = "24";
String job = "Developer";
String info = userName + age + job;

要獲得上面的info,就會userName和age拼接生成臨時一個String對象t1,內容爲Andy24,而後有t1和job拼接生成最終咱們須要的info對象,這其中,產生了一箇中間的t1,並且t1建立以後,沒有主動回收,勢必會佔必定的空間。若是是一個不少(假設上百個,多見於對對象的toString的調用)字符串的拼接,那麼代價就更大了,性能一下會下降不少。性能

編譯器的優化處理

真的會有上面的性能代價麼,字符串拼接這麼經常使用,沒有特殊的處理優化麼,答案是有的,這個優化進行在編譯器編譯.java到bytecode時。優化

一個Java程序若是想運行起來,須要通過兩個時期,編譯時和運行時。在編譯時,Java 編譯器(Compiler)將java文件轉換成字節碼。在運行時,Java虛擬機(JVM)運行編譯時生成的字節碼。經過這樣兩個時期,Java作到了所謂的一處編譯,到處運行。ui

咱們實驗一下編譯期都作了哪些優化,咱們製造一段可能會出現性能代價的代碼。spa

fileos:false設計

1
2
3
4
5
6
7
8
9
public class Concatenation {
  public static void main(String[] args) {
      String userName = "Andy";
      String age = "24";
      String job = "Developer";
      String info = userName + age + job;
      System.out.println(info);
  }
}

對Concatenation.java進行編譯一下。獲得Concatenation.class

fileos:false

1
javac Concatenation.java

而後咱們使用javap反編譯一下編譯出來的Concatenation.class文件。javap -c Concatenation。若是沒有找到javap命令,請考慮將javap所在目錄加入環境變量或者使用javap的完整路徑。

fileos:false

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
17:22:04-androidyue~/workspace_adt/strings/src$ javap -c Concatenation
Compiled from "Concatenation.java"
public class Concatenation {
  public Concatenation();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return        

  public static void main(java.lang.String[]);
    Code:
       0: ldc           #2                  // String Andy
       2: astore_1
       3: ldc           #3                  // String 24
       5: astore_2
       6: ldc           #4                  // String Developer
       8: astore_3
       9: new           #5                  // class java/lang/StringBuilder
      12: dup
      13: invokespecial #6                  // Method java/lang/StringBuilder."<init>":()V
      16: aload_1
      17: invokevirtual #7                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      20: aload_2
      21: invokevirtual #7                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      24: aload_3
      25: invokevirtual #7                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      28: invokevirtual #8                  // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
      31: astore        4
      33: getstatic     #9                  // Field java/lang/System.out:Ljava/io/PrintStream;
      36: aload         4
      38: invokevirtual #10                 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
      41: return
}

其中,ldc,astore等爲java字節碼的指令,相似彙編指令。後面的註釋使用了Java相關的內容進行了說明。 咱們能夠看到上面有不少StringBuilder,可是咱們在Java代碼裏並無顯示地調用,這就是Java編譯器作的優化,當Java編譯器遇到字符串拼接的時候,會建立一個StringBuilder對象,後面的拼接,其實是調用StringBuilder對象的append方法。這樣就不會有咱們上面擔憂的問題了。

僅靠編譯器優化?

既然編譯器幫咱們作了優化,是否是僅僅依靠編譯器的優化就夠了呢,固然不是。 
下面咱們看一段未優化性能較低的代碼

fileos:false

1
2
3
4
5
6
7
public void  implicitUseStringBuilder(String[] values) {
  String result = "";
  for (int i = 0 ; i < values.length; i ++) {
      result += values[i];
  }
  System.out.println(result);
}

使用javac編譯,使用javap查看

fileos:false

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
public void implicitUseStringBuilder(java.lang.String[]);
    Code:
       0: ldc           #11                 // String 
       2: astore_2
       3: iconst_0
       4: istore_3
       5: iload_3
       6: aload_1
       7: arraylength
       8: if_icmpge     38
      11: new           #5                  // class java/lang/StringBuilder
      14: dup
      15: invokespecial #6                  // Method java/lang/StringBuilder."<init>":()V
      18: aload_2
      19: invokevirtual #7                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      22: aload_1
      23: iload_3
      24: aaload
      25: invokevirtual #7                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      28: invokevirtual #8                  // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
      31: astore_2
      32: iinc          3, 1
      35: goto          5
      38: getstatic     #9                  // Field java/lang/System.out:Ljava/io/PrintStream;
      41: aload_2
      42: invokevirtual #10                 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
      45: return

其中8: if_icmpge 38 和35: goto 5構成了一個循環。8: if_icmpge 38的意思是若是JVM操做數棧的整數對比大於等於(i < values.length的相反結果)成立,則跳到第38行(System.out)。35: goto 5則表示直接跳到第5行。

可是這裏面有一個很重要的就是StringBuilder對象建立發生在循環之間,也就是意味着有多少次循環會建立多少個StringBuilder對象,這樣明顯很差。赤裸裸地低水平代碼啊。

稍微優化一下,瞬間提高逼格。

fileos:false

1
2
3
4
5
6
public void explicitUseStringBuider(String[] values) {
  StringBuilder result = new StringBuilder();
  for (int i = 0; i < values.length; i ++) {
      result.append(values[i]);
  }
}

對應的編譯後的信息

fileos:false

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
public void explicitUseStringBuider(java.lang.String[]);
    Code:
       0: new           #5                  // class java/lang/StringBuilder
       3: dup
       4: invokespecial #6                  // Method java/lang/StringBuilder."<init>":()V
       7: astore_2
       8: iconst_0
       9: istore_3
      10: iload_3
      11: aload_1
      12: arraylength
      13: if_icmpge     30
      16: aload_2
      17: aload_1
      18: iload_3
      19: aaload
      20: invokevirtual #7                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      23: pop
      24: iinc          3, 1
      27: goto          10
      30: return

從上面能夠看出,13: if_icmpge 3027: goto 10構成了一個loop循環,而0: new #5位於循環以外,因此不會屢次建立StringBuilder.

總的來講,咱們在循環體中須要儘可能避免隱式或者顯式建立StringBuilder. 因此那些瞭解代碼如何編譯,內部如何執行的人,寫的代碼檔次都比較高。

以上文章,若有錯誤,請批評指正 。

相關文章
相關標籤/搜索