前段時間,給星球的球友們專門碼了一篇文章《深刻分析Java的編譯原理》,其中深刻的介紹了Java中的javac編譯和JIT編譯的區別及原理。並在文中提到:JIT編譯除了具備緩存的功能外,還會對代碼作各類優化,好比:逃逸分析、 鎖消除、 鎖膨脹、 方法內聯、 空值檢查消除、 類型檢測消除、 公共子表達式消除等。java
有球友閱讀完這部份內容後,對JVM產生了濃厚的興趣,本身回去專門學習了一下,在學習過程當中遇到一個小問題,關於Java內存分配的。因此和我在微信上作過簡單的交流。主要涉及到Java中的堆和棧、數組內存分配、逃逸分析、編譯優化等技術及原理。本文也是關於這部分知識點的分享。算法
關於JVM的內存結構及內存分配方式,不是本文的重點,這裏只作簡單回顧。如下是咱們知道的一些常識:數組
一、根據Java虛擬機規範,Java虛擬機所管理的內存包括方法區、虛擬機棧、本地方法棧、堆、程序計數器等。緩存
二、咱們一般認爲JVM中運行時數據存儲包括堆和棧。這裏所提到的棧其實指的是虛擬機棧,或者說是虛擬棧中的局部變量表。微信
三、棧中存放一些基本類型的變量數據(int/short/long/byte/float/double/Boolean/char)和對象引用。多線程
四、堆中主要存放對象,即經過new關鍵字建立的對象。app
五、數組引用變量是存放在棧內存中,數組元素是存放在堆內存中。函數
在《深刻理解Java虛擬機中》關於Java堆內存有這樣一段描述:學習
可是,隨着JIT編譯期的發展與逃逸分析技術逐漸成熟,棧上分配、標量替換優化技術將會致使一些微妙的變化,全部的對象都分配到堆上也漸漸變得不那麼「絕對」了。優化
這裏只是簡單提了一句,並無深刻分析,不少人看到這裏因爲對JIT、逃逸分析等技術不瞭解,因此也沒法真正理解上面這段話的含義。
PS:這裏默認你們都瞭解什麼是JIT,不瞭解的朋友能夠先自行Google瞭解下,或者加入個人知識星球,閱讀那篇球友專享文章。
其實,在編譯期間,JIT會對代碼作不少優化。其中有一部分優化的目的就是減小內存堆分配壓力,其中一種重要的技術叫作逃逸分析。
逃逸分析(Escape Analysis)是目前Java虛擬機中比較前沿的優化技術。這是一種能夠有效減小Java 程序中同步負載和內存堆分配壓力的跨函數全局數據流分析算法。經過逃逸分析,Java Hotspot編譯器可以分析出一個新的對象的引用的使用範圍從而決定是否要將這個對象分配到堆上。
逃逸分析的基本行爲就是分析對象動態做用域:當一個對象在方法中被定義後,它可能被外部方法所引用,例如做爲調用參數傳遞到其餘地方中,稱爲方法逃逸。
例如:
public static StringBuffer craeteStringBuffer(String s1, String s2) {
StringBuffer sb = new StringBuffer();
sb.append(s1);
sb.append(s2);
return sb;
}
複製代碼
StringBuffer sb是一個方法內部變量,上述代碼中直接將sb返回,這樣這個StringBuffer有可能被其餘方法所改變,這樣它的做用域就不僅是在方法內部,雖然它是一個局部變量,稱其逃逸到了方法外部。甚至還有可能被外部線程訪問到,譬如賦值給類變量或能夠在其餘線程中訪問的實例變量,稱爲線程逃逸。
上述代碼若是想要StringBuffer sb不逃出方法,能夠這樣寫:
public static String createStringBuffer(String s1, String s2) {
StringBuffer sb = new StringBuffer();
sb.append(s1);
sb.append(s2);
return sb.toString();
}
複製代碼
不直接返回 StringBuffer,那麼StringBuffer將不會逃逸出方法。
使用逃逸分析,編譯器能夠對代碼作以下優化:
1、同步省略。若是一個對象被發現只能從一個線程被訪問到,那麼對於這個對象的操做能夠不考慮同步。
2、將堆分配轉化爲棧分配。若是一個對象在子程序中被分配,要使指向該對象的指針永遠不會逃逸,對象多是棧分配的候選,而不是堆分配。
3、分離對象或標量替換。有的對象可能不須要做爲一個連續的內存結構存在也能夠被訪問到,那麼對象的部分(或所有)能夠不存儲在內存,而是存儲在CPU寄存器中。
上面的關於同步省略的內容,我在《深刻理解多線程(五)—— Java虛擬機的鎖優化技術》中有介紹過,即鎖優化中的鎖消除技術,依賴的也是逃逸分析技術。
本文,主要來介紹逃逸分析的第二個用途:將堆分配轉化爲棧分配。
其實,以上三種優化中,棧上內存分配實際上是依靠標量替換來實現的。因爲不是本文重點,這裏就不展開介紹了。若是你們感興趣,我後面專門出一篇文章,全面介紹下逃逸分析。
在Java代碼運行時,經過JVM參數可指定是否開啓逃逸分析, -XX:+DoEscapeAnalysis
: 表示開啓逃逸分析 -XX:-DoEscapeAnalysis
: 表示關閉逃逸分析 從jdk 1.7開始已經默認開始逃逸分析,如需關閉,須要指定-XX:-DoEscapeAnalysis
咱們知道,在通常狀況下,對象和數組元素的內存分配是在堆內存上進行的。可是隨着JIT編譯器的日漸成熟,不少優化使這種分配策略並不絕對。JIT編譯器就能夠在編譯期間根據逃逸分析的結果,來決定是否能夠將對象的內存分配從堆轉化爲棧。
咱們來看如下代碼:
public static void main(String[] args) {
long a1 = System.currentTimeMillis();
for (int i = 0; i < 1000000; i++) {
alloc();
}
// 查看執行時間
long a2 = System.currentTimeMillis();
System.out.println("cost " + (a2 - a1) + " ms");
// 爲了方便查看堆內存中對象個數,線程sleep
try {
Thread.sleep(100000);
} catch (InterruptedException e1) {
e1.printStackTrace();
}
}
private static void alloc() {
User user = new User();
}
static class User {
}
複製代碼
其實代碼內容很簡單,就是使用for循環,在代碼中建立100萬個User對象。
咱們在alloc方法中定義了User對象,可是並無在方法外部引用他。也就是說,這個對象並不會逃逸到alloc外部。通過JIT的逃逸分析以後,就能夠對其內存分配進行優化。
咱們指定如下JVM參數並運行:
-Xmx4G -Xms4G -XX:-DoEscapeAnalysis -XX:+PrintGCDetails -XX:+HeapDumpOnOutOfMemoryError
複製代碼
在程序打印出 cost XX ms
後,代碼運行結束以前,咱們使用[jmap][1]
命令,來查看下當前堆內存中有多少個User對象:
➜ ~ jps
2809 StackAllocTest
2810 Jps
➜ ~ jmap -histo 2809
num #instances #bytes class name
----------------------------------------------
1: 524 87282184 [I
2: 1000000 16000000 StackAllocTest$User
3: 6806 2093136 [B
4: 8006 1320872 [C
5: 4188 100512 java.lang.String
6: 581 66304 java.lang.Class
複製代碼
從上面的jmap執行結果中咱們能夠看到,堆中共建立了100萬個StackAllocTest$User
實例。
在關閉逃避分析的狀況下(-XX:-DoEscapeAnalysis),雖然在alloc方法中建立的User對象並無逃逸到方法外部,可是仍是被分配在堆內存中。也就說,若是沒有JIT編譯器優化,沒有逃逸分析技術,正常狀況下就應該是這樣的。即全部對象都分配到堆內存中。
接下來,咱們開啓逃逸分析,再來執行下以上代碼。
-Xmx4G -Xms4G -XX:+DoEscapeAnalysis -XX:+PrintGCDetails -XX:+HeapDumpOnOutOfMemoryError
複製代碼
在程序打印出 cost XX ms
後,代碼運行結束以前,咱們使用jmap
命令,來查看下當前堆內存中有多少個User對象:
➜ ~ jps
709
2858 Launcher
2859 StackAllocTest
2860 Jps
➜ ~ jmap -histo 2859
num #instances #bytes class name
----------------------------------------------
1: 524 101944280 [I
2: 6806 2093136 [B
3: 83619 1337904 StackAllocTest$User
4: 8006 1320872 [C
5: 4188 100512 java.lang.String
6: 581 66304 java.lang.Class
複製代碼
從以上打印結果中能夠發現,開啓了逃逸分析以後(-XX:+DoEscapeAnalysis),在堆內存中只有8萬多個StackAllocTest$User
對象。也就是說在通過JIT優化以後,堆內存中分配的對象數量,從100萬降到了8萬。
除了以上經過jmap驗證對象個數的方法之外,讀者還能夠嘗試將堆內存調小,而後執行以上代碼,根據GC的次數來分析,也能發現,開啓了逃逸分析以後,在運行期間,GC次數會明顯減小。正是由於不少堆上分配被優化成了棧上分配,因此GC次數有了明顯的減小。
因此,若是之後再有人問你:是否是全部的對象和數組都會在堆內存分配空間?
那麼你能夠告訴他:不必定,隨着JIT編譯器的發展,在編譯期間,若是JIT通過逃逸分析,發現有些對象沒有逃逸出方法,那麼有可能堆內存分配會被優化成棧內存分配。可是這也並非絕對的。就像咱們前面看到的同樣,在開啓逃逸分析以後,也並非全部User對象都沒有在堆上分配。