Java String學習筆記

參照:https://www.jianshu.com/p/2f209af80f84java

常量池:

Java代碼被編譯成class文件時,會生成一個常量池(Constant pool)的數據結構,用以保存字面常量和符號引用(類名、方法名、接口名和字段名等)。數組

package com.ctrip.ttd.whywhy;
public class Test {  
    public static void main(String[] args) {  
        String test = "test";  
    }  
}

經過命令javap -verbose查看class文件中Constant pool實現:數據結構

Constant pool:
   #1 = Methodref          #4.#13         // java/lang/Object."<init>":()V
   #2 = String             #14            // test
   #3 = Class              #15            // com/ctrip/ttd/whywhy/test
   #4 = Class              #16            // java/lang/Object
   #5 = Utf8               <init>
   #6 = Utf8               ()V
   #7 = Utf8               Code
   #8 = Utf8               LineNumberTable
   #9 = Utf8               main
  #10 = Utf8               ([Ljava/lang/String;)V
  #11 = Utf8               SourceFile
  #12 = Utf8               test.java
  #13 = NameAndType        #5:#6          // "<init>":()V
  #14 = Utf8 test
  #15 = Utf8               com/ctrip/ttd/whywhy/test
  #16 = Utf8               java/lang/Object

在main方法字節碼指令中,0 ~ 2行對應代碼 String test = "test"; 由兩部分組成:ldc #2 和 astore_1。app

// main方法字節碼指令
 public static void main(java.lang.String[]);
   Code:
      0: ldc           #2                  // String test
      2: astore_1
      3: return

一、Test類加載到虛擬機時,"test"字符串在Constant pool中使用符號引用symbol表示,當調用 ldc #2 指令時,若是Constant pool中索引 #2 的symbol還未解析,則調用C++底層的 StringTable::intern 方法生成char數組,並將引用保存在StringTable和常量池中,當下次調用 ldc #2 時,能夠直接從Constant pool根據索引 #2獲取 "test" 字符串的引用,避免再次到StringTable中查找。優化

二、astore_1指令將"test"字符串的引用保存在局部變量表中。ui

常量池的內存分配

在 JDK六、七、8中有不一樣的實現:
一、JDK6及以前版本中,常量池的內存在永久代PermGen進行分配,因此常量池會受到PermGen內存大小的限制。
二、JDK7中,常量池的內存在Java堆上進行分配,意味着常量池不受固定大小的限制了。
三、JDK8中,虛擬機團隊移除了永久代PermGen。

字面常量

public class StringTest {
    public static void main(String[] args) {
        String a = "java";
        String b = "java";
        String c = "ja" + "va";
    }
}

經過 "javap -c" 命令查看字節碼指令實現:spa

其中ldc指令將int、float和String類型的常量值從常量池中推送到棧頂,因此a和b都指向常量池的"java"字符串
經過指令實現能夠發現:變量a、b和c都指向常量池的 "java" 字符串,表達式 "ja" + "va" 在編譯期間會把結果值"java"直接賦值給c。

String對象

public class StringTest {
    public static void main(String[] args) {
        String a = "java";
        String c = new String("java");
    }
}

這種狀況下,a == c 成立麼?字節碼實現以下:
3d

 
其中3 ~ 9行指令對應代碼 String c = new String("java"); 實現:
一、第3行new指令,在Java堆上爲String對象申請內存;
二、第7行ldc指令,嘗試從常量池中獲取"java"字符串,若是常量池中不存在,則在常量池中新建"java"字符串,並返回;
三、第9行invokespecial指令,調用構造方法,初始化String對象。
 

其中String對象中使用char數組存儲字符串,變量a指向常量池的"java"字符串,變量c指向Java堆的String對象,且該對象的char數組指向常量池的"java"字符串,因此很顯然 a != c,以下圖所示:code

 

**經過 "字面量 + String對象" 進行賦值會發生什麼? **orm

public class StringTest {
    public static void main(String[] args) {
        String a = "hello ";
        String b = "world";
        String c = a + b;
        String d = "hello world";
    }
}

這種狀況下,c == d成立麼?字節碼實現以下:

 
 

其中6 ~ 21行指令對應代碼 String c = a + b; 實現:
一、第6行new指令,在Java堆上爲StringBuilder對象申請內存;
二、第10行invokespecial指令,調用構造方法,初始化StringBuilder對象;
三、第1四、18行invokespecial指令,調用append方法,添加a和b字符串;
四、第21行invokespecial指令,調用toString方法,生成String對象。

 

經過指令實現能夠發現,字符串變量的鏈接動做,在編譯階段會被轉化成StringBuilder的append操做,變量c最終指向Java堆上新建String對象,變量d指向常量池的"hello world"字符串,因此 c != d。

不過有種特殊狀況,當final修飾的變量發生鏈接動做時,虛擬機會進行優化,將表達式結果直接賦值給目標變量:

public class StringTest {
    public static void main(String[] args) {
        final String a = "hello ";
        final String b = "world";
        String c = a + b;
        String d = "hello world";
    }
}

指令實現以下:

c == d
相關文章
相關標籤/搜索