常量池-深刻淺出java常量池

時間 2019-12-07

標籤常量深刻 java 欄目 Java 简体版

原文原文鏈接

理論java

jvm虛擬內存分佈：數組

程序計數器是jvm執行程序的流水線，存放一些跳轉指令。緩存

本地方法棧是jvm調用操做系統方法所使用的棧。網絡

虛擬機棧是jvm執行java代碼所使用的棧。jvm

方法區存放了一些常量、靜態變量、類信息等，能夠理解成class文件在內存中的存放位置。性能

虛擬機堆是jvm執行java代碼所使用的堆。優化

Java中的常量池，實際上分爲兩種形態：靜態常量池和運行時常量池。spa

所謂靜態常量池（一個class對應一個靜態常量池），即*.class文件中的常量池，class文件中的常量池不只僅包含字符串(數字)字面量，還包含類、方法的信息，佔用class文件絕大部分空間。這種常量池主要用於存放兩大類常量：字面量(Literal)和符號引用量(Symbolic References)，字面量至關於Java語言層面常量的概念，如文本字符串，聲明爲final的常量值等，符號引用則屬於編譯原理方面的概念，包括了以下三種類型的常量：操作系統

類和接口的全限定名
字段名稱和描述符
方法名稱和描述符

而運行時常量池，則是jvm虛擬機在完成類裝載操做後，將class文件中的常量池載入到內存中，並保存在方法區中，咱們常說的常量池，就是指方法區中的運行時常量池。翻譯

運行時常量池相對於CLass文件常量池的另一個重要特徵是具有動態性，Java語言並不要求常量必定只有編譯期才能產生，也就是並不是預置入CLass文件中常量池的內容才能進入方法區運行時常量池，運行期間也可能將新的常量放入池中，這種特性被開發人員利用比較多的就是String類的intern()方法。

String的intern()方法會查找在常量池中是否存在一份equal相等的字符串,若是有則返回該字符串的引用,若是沒有則添加本身的字符串進入常量池。

程序運行時，除非手動向常量池中添加常量(好比調用intern方法)，不然jvm不會自動添加常量到常量池。

8種基本類型的常量池都是系統協調的，String類型的常量池比較特殊。它的主要使用方法有兩種：

1）直接使用雙引號聲明出來的String對象會直接存儲在常量池中。
2）若是不是用雙引號聲明的String對象，可使用String提供的intern方法。intern 方法會從字符串常量池中查詢當前字符串是否存在，若不存在就會將當前字符串放入常量池中

常量池的好處
常量池是爲了不頻繁的建立和銷燬對象而影響系統性能，其實現了對象的共享。
例如字符串常量池，在編譯階段就把全部的字符串文字放到一個常量池中。
（1）節省內存空間：常量池中全部相同的字符串常量被合併，只佔用一個空間。
（2）節省運行時間：比較字符串時，==比equals()快。對於兩個引用變量，只用==判斷引用是否相等，也就能夠判斷實際值是否相等。

接下來咱們引用一些網絡上流行的常量池例子，而後藉以講解。

1 String s1 = "Hello";
 2 String s2 = "Hello";
 3 String s3 = "Hel" + "lo";
 4 String s4 = "Hel" + new String("lo");
 5 String s5 = new String("Hello");
 6 String s6 = s5.intern();
 7 String s7 = "H";
 8 String s8 = "ello";
 9 String s9 = s7 + s8;
10           
11 System.out.println(s1 == s2);  // true
12 System.out.println(s1 == s3);  // true
13 System.out.println(s1 == s4);  // false
14 System.out.println(s1 == s9);  // false
15 System.out.println(s4 == s5);  // false
16 System.out.println(s1 == s6);  // true

首先說明一點，在java 中，直接使用==操做符，比較的是兩個字符串的引用地址，並非比較內容，比較內容請用String.equals()。

s1 == s2這個很是好理解，s一、s2在賦值時，均使用的字符串字面量，說白話點，就是直接把字符串寫死，在編譯期間，這種字面量會直接放入class文件的常量池中，從而實現複用，載入運行時常量池後，s一、s2指向的是同一個內存地址，因此相等。

s1 == s3這個地方有個坑，s3雖然是動態拼接出來的字符串，可是全部參與拼接的部分都是已知的字面量，在編譯期間，這種拼接會被優化，編譯器直接幫你拼好，所以String s3 = "Hel" + "lo";在class文件中被優化成String s3 = "Hello"，因此s1 == s3成立。只有使用引號包含文本的方式建立的String對象之間使用「+」鏈接產生的新對象纔會被加入字符串池中。

s1 == s4固然不相等，s4雖然也是拼接出來的，但new String("lo")這部分不是已知字面量，是一個不可預料的部分，編譯器不會優化，必須等到運行時才能夠肯定結果，結合字符串不變定理，鬼知道s4被分配到哪去了，因此地址確定不一樣。對於全部包含new方式新建對象（包括null）的「+」鏈接表達式，它所產生的新對象都不會被加入字符串池中。

配上一張簡圖理清思路：

s1 == s9也不相等，道理差很少，雖然s七、s8在賦值的時候使用的字符串字面量，可是拼接成s9的時候，s七、s8做爲兩個變量，都是不可預料的，編譯器畢竟是編譯器，不可能當解釋器用，不能在編譯期被肯定，因此不作優化，只能等到運行時，在堆中建立s七、s8拼接成的新字符串，在堆中地址不肯定，不可能與方法區常量池中的s1地址相同。

s4 == s5已經不用解釋了，絕對不相等，兩者都在堆中，但地址不一樣。

s1 == s6這兩個相等徹底歸功於intern方法，s5在堆中，內容爲Hello ，intern方法會嘗試將Hello字符串添加到常量池中，並返回其在常量池中的地址，由於常量池中已經有了Hello字符串，因此intern方法直接返回地址；而s1在編譯期就已經指向常量池了，所以s1和s6指向同一地址，相等。

特例1

public static final String A = "ab"; // 常量A
public static final String B = "cd"; // 常量B
public static void main(String[] args) {
     String s = A + B;  // 將兩個常量用+鏈接對s進行初始化 
     String t = "abcd";   
    if (s == t) {   
         System.out.println("s等於t，它們是同一個對象");   
     } else {   
         System.out.println("s不等於t，它們不是同一個對象");   
     }   
 } 
s等於t，它們是同一個對象

A和B都是常量，值是固定的，所以s的值也是固定的，它在類被編譯時就已經肯定了。也就是說：String s=A+B; 等同於：String s="ab"+"cd";

特例2

public static final String A; // 常量A
public static final String B;    // 常量B
static {   
     A = "ab";   
     B = "cd";   
 }   
 public static void main(String[] args) {   
    // 將兩個常量用+鏈接對s進行初始化   
     String s = A + B;   
     String t = "abcd";   
    if (s == t) {   
         System.out.println("s等於t，它們是同一個對象");   
     } else {   
         System.out.println("s不等於t，它們不是同一個對象");   
     }   
 } 
s不等於t，它們不是同一個對象

A和B雖然被定義爲常量，可是它們都沒有立刻被賦值。在運算出s的值以前，他們什麼時候被賦值，以及被賦予什麼樣的值，都是個變數。所以A和B在被賦值以前，性質相似於一個變量。那麼s就不能在編譯期被肯定，而只能在運行時被建立了。

至此，咱們能夠得出三個很是重要的結論：

必需要關注編譯期的行爲，才能更好的理解常量池。

運行時常量池中的常量，基原本源於各個class文件中的常量池。

程序運行時，除非手動向常量池中添加常量(好比調用intern方法)，不然jvm不會自動添加常量到常量池。

以上所講僅涉及字符串常量池，實際上還有整型常量池、浮點型常量池(java中基本類型的包裝類的大部分都實現了常量池技術，即Byte,Short,Integer,Long,Character,Boolean；兩種浮點數類型的包裝類Float,Double並無實現常量池技術) 等等，但都大同小異，只不過數值類型的常量池不能夠手動添加常量，程序啓動時常量池中的常量就已經肯定了，好比整型常量池中的常量範圍：-128~127，（Byte,Short,Integer,Long,Character,Boolean）這5種包裝類默認建立了數值[-128，127]的相應類型的緩存數據，可是超出此範圍仍然會去建立新的對象。

例如在自動裝箱時，把int變成Integer的時候，是有規則的，當你的int的值在-128-IntegerCache.high(127) 時，返回的不是一個新new出來的Integer對象，而是一個已經緩存在堆中的Integer對象，（咱們能夠這樣理解，系統已經把-128到127之間的Integer緩存到一個Integer數組中去了，若是你要把一個int變成一個Integer對象，首先去緩存中找，找到的話直接返回引用給你就行了，沒必要再新new一個），若是不在-128-IntegerCache.high(127) 時會返回一個新new出來的Integer對象。

實踐

說了這麼多理論，接下來讓咱們觸摸一下真正的常量池。

前文提到過，class文件中存在一個靜態常量池，這個常量池是由編譯器生成的，用來存儲java源文件中的字面量(本文僅僅關注字面量)，假設咱們有以下java代碼：

1 String s = "hi";

爲了方便起見，就這麼簡單，沒錯！將代碼編譯成class文件後，用winhex打開二進制格式的class文件。如圖：

簡單講解一下class文件的結構，開頭的4個字節是class文件魔數，用來標識這是一個class文件，說白話點就是文件頭，既：CA FE BA BE。

緊接着4個字節是java的版本號，這裏的版本號是34，由於筆者是用jdk8編譯的，版本號的高低和jdk版本的高低相對應，高版本能夠兼容低版本，但低版本沒法執行高版本。因此，若是哪天讀者想知作別人的class文件是用什麼jdk版本編譯的，就能夠看這4個字節。

接下來就是常量池入口，入口處用2個字節標識常量池常量數量，本例中數值爲00 1A，翻譯成十進制是26，也就是有25個常量，其中第0個常量是特殊值，因此只有25個常量。

常量池中存放了各類類型的常量，他們都有本身的類型，而且都有本身的存儲規範，本文只關注字符串常量，字符串常量以01開頭(1個字節)，接着用2個字節記錄字符串長度，而後就是字符串實際內容。本例中爲：01 00 02 68 69。

接下來再說說運行時常量池，因爲運行時常量池在方法區中，咱們能夠經過jvm參數：-XX:PermSize、-XX:MaxPermSize來設置方法區大小，從而間接限制常量池大小。

假設jvm啓動參數爲：-XX:PermSize＝2M -XX:MaxPermSize＝2M，而後運行以下代碼：

1 //保持引用，防止自動垃圾回收
2 List<String> list = new ArrayList<String>();
3         
4 int i = 0;
5         
6 while(true){
7     //經過intern方法向常量池中手動添加常量
8     list.add(String.valueOf(i++).intern());
9 }

程序馬上會拋出：Exception in thread "main" java.lang.outOfMemoryError: PermGen space異常。PermGen space正是方法區，足以說明常量池在方法區中。

在jdk8中，移除了方法區，轉而用Metaspace區域替代，因此咱們須要使用新的jvm參數：-XX:MaxMetaspaceSize=2M，依然運行如上代碼，拋出：java.lang.OutOfMemoryError: Metaspace異常。同理說明運行時常量池是劃分在Metaspace區域中。具體關於Metaspace區域的知識，請自行搜索。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。