觸摸java常量池

     java常量池是一個經久不衰的話題,也是面試官的最愛,題目花樣百出,小菜早就對常量池有所耳聞,此次好好總結一下。java

 

理論面試

     

     小菜先拙劣的表達一下jvm虛擬內存分佈:網絡

jvm虛擬內存分佈

 

     程序計數器是jvm執行程序的流水線,存放一些跳轉指令,這個過高深,小菜不懂。jvm

     本地方法棧是jvm調用操做系統方法所使用的棧。測試

     虛擬機棧是jvm執行java代碼所使用的棧。優化

     方法區存放了一些常量、靜態變量、類信息等,能夠理解成class文件在內存中的存放位置。spa

     虛擬機堆是jvm執行java代碼所使用的堆。操作系統

     Java中的常量池,實際上分爲兩種形態:靜態常量池運行時常量池翻譯

     所謂靜態常量池,即*.class文件中的常量池,class文件中的常量池不只僅包含字符串(數字)字面量,還包含類、方法的信息,佔用class文件絕大部分空間。code

     而運行時常量池,則是jvm虛擬機在完成類裝載操做後,將class文件中的常量池載入到內存中,並保存在方法區中,咱們常說的常量池,就是指方法區中的運行時常量池。

     接下來咱們引用一些網絡上流行的常量池例子,而後藉以講解。

複製代碼
 1 String s1 = "Hello";  2 String s2 = "Hello";  3 String s3 = "Hel" + "lo";  4 String s4 = "Hel" + new String("lo");  5 String s5 = new String("Hello");  6 String s6 = s5.intern();  7 String s7 = "H";  8 String s8 = "ello";  9 String s9 = s7 + s8; 10 11 System.out.println(s1 == s2); // true 12 System.out.println(s1 == s3); // true 13 System.out.println(s1 == s4); // false 14 System.out.println(s1 == s9); // false 15 System.out.println(s4 == s5); // false 16 System.out.println(s1 == s6); // true
複製代碼

     首先說明一點,在java 中,直接使用==操做符,比較的是兩個字符串的引用地址,並非比較內容,比較內容請用String.equals()。

     s1 == s2這個很是好理解,s一、s2在賦值時,均使用的字符串字面量,說白話點,就是直接把字符串寫死,在編譯期間,這種字面量會直接放入class文件的常量池中,從而實現複用,載入運行時常量池後,s一、s2指向的是同一個內存地址,因此相等。

     s1 == s3這個地方有個坑,s3雖然是動態拼接出來的字符串,可是全部參與拼接的部分都是已知的字面量,在編譯期間,這種拼接會被優化,編譯器直接幫你拼好,因 此String s3 = "Hel" + "lo";在class文件中被優化成String s3 = "Hello";,因此s1 == s3成立。

     s1 == s4固然不相等,s4雖然也是拼接出來的,但new String("lo")這部分不是已知字面量,是一個不可預料的部分,編譯器不會優化,必須等到運行時才能夠肯定結果,結合字符串不變定理,鬼知道s4被分配到哪去了,因此地址確定不一樣。配上一張簡圖理清思路:

java字符串不變     s1 == s9也不相等,道理差很少,雖然s七、s8在賦值的時候使用的字符串字面量,可是拼接成s9的時候,s七、s8做爲兩個變量,都是不可預料的,編譯器畢竟 是編譯器,不可能當解釋器用,因此不作優化,等到運行時,s七、s8拼接成的新字符串,在堆中地址不肯定,不可能與方法區常量池中的s1地址相同。
jvm常量池,堆,棧內存分佈

     s4 == s5已經不用解釋了,絕對不相等,兩者都在堆中,但地址不一樣。

     s1 == s6這兩個相等徹底歸功於intern方法,s5在堆中,內容爲Hello ,intern方法會嘗試將Hello字符串添加到常量池中,並返回其在常量池中的地址,由於常量池中已經有了Hello字符串,因此intern方法直 接返回地址;而s1在編譯期就已經指向常量池了,所以s1和s6指向同一地址,相等。

     至此,咱們能夠得出三個很是重要的結論:

 

           必需要關注編譯期的行爲,才能更好的理解常量池。

           運行時常量池中的常量,基原本源於各個class文件中的常量池。

           程序運行時,除非手動向常量池中添加常量(好比調用intern方法),不然jvm不會自動添加常量到常量池。

 

     以上所講僅涉及字符串常量池,實際上還有整型常量池、浮點型常量池等等,但都大同小異,只不過數值類型的常量池不能夠手動添加常量,程序啓動時常量池中的常量就已經肯定了,好比整型常量池中的常量範圍:-128~127,只有這個範圍的數字能夠用到常量池。

 

實踐

     

     說了這麼多理論,接下來讓咱們觸摸一下真正的常量池。

     前文提到過,class文件中存在一個靜態常量池,這個常量池是由編譯器生成的,用來存儲java源文件中的字面量(本文僅僅關注字面量),假設咱們有以下java代碼:

 

1 String s = "hi";

 

     爲了方便起見,就這麼簡單,沒錯!將代碼編譯成class文件後,用winhex打開二進制格式的class文件。如圖:

 二進制格式的class文件

 

     簡單講解一下class文件的結構,開頭的4個字節是class文件魔數,用來標識這是一個class文件,說白話點就是文件頭,既:CA FE BA BE。

     緊接着4個字節是java的版本號,這裏的版本號是34,由於筆者是用jdk8編譯的,版本號的高低和jdk版本的高低相對應,高版本能夠兼容低版本, 但低版本沒法執行高版本。因此,若是哪天讀者想知作別人的class文件是用什麼jdk版本編譯的,就能夠看這4個字節。

     接下來就是常量池入口,入口處用2個字節標識常量池常量數量,本例中數值爲00 1A,翻譯成十進制是26,也就是有25個常量,其中第0個常量是特殊值,因此只有25個常量。

     常量池中存放了各類類型的常量,他們都有本身的類型,而且都有本身的存儲規範,本文只關注字符串常量,字符串常量以01開頭(1個字節),接着用2個字節記錄字符串長度,而後就是字符串實際內容。本例中爲:01 00 02 68 69。

     接下來再說說運行時常量池,因爲運行時常量池在方法區中,咱們能夠經過jvm參數:-XX:PermSize、-XX:MaxPermSize來設置方法區大小,從而間接限制常量池大小。

     假設jvm啓動參數爲:-XX:PermSize=2M -XX:MaxPermSize=2M,而後運行以下代碼:

複製代碼
1 //保持引用,防止自動垃圾回收 2 List<String> list = new ArrayList<String>(); 3 4 int i = 0; 5 6 while(true){ 7 //經過intern方法向常量池中手動添加常量 8 list.add(String.valueOf(i++).intern()); 9 }
複製代碼

     程序馬上會拋出:Exception in thread "main" java.lang.outOfMemoryError: PermGen space異常。PermGen space正是方法區,足以說明常量池在方法區中。

     在jdk8中,移除了方法區,轉而用Metaspace區域替代,因此咱們須要使用新的jvm參數:-XX:MaxMetaspaceSize=2M, 依然運行如上代碼,拋出:java.lang.OutOfMemoryError: Metaspace異常。同理說明運行時常量池是劃分在Metaspace區域中。具體關於Metaspace區域的知識,請讀者自行搜索。

     本文全部代碼均在jdk七、jdk8下測試經過,其餘版本jdk可能會略有差別,請讀者自行探索。

相關文章
相關標籤/搜索