本文摘自深刻理解 Java 虛擬機第三版數組
Java 是一門面向對象的語言,Java 程序運行過程當中無時無刻都有對象被建立出來。從語言層面看,建立對象只是一個 new 關鍵字而已,而在虛擬機中,對象(僅限於普通 Java 對象,不包括數組和 Class 對象等)的建立又是怎麼一個過程呢?安全
以 Hotspot 虛擬機爲例,當虛擬機遇到一條字節碼指令,首先會檢查這個指令的參數是否能在常量池中定位到一個符號引用,並檢查這個符號引用表明的類是否已被加載、解析和初始化,若是沒有,那麼會先執行對應的類加載過程數據結構
類加載檢查經過後,虛擬機將爲新生對象分配內存。對象所需內存的大小在類加載過程當中便可徹底肯定,爲對象分配空間的任務實際上等同於把一塊肯定大小的內存區域從 Java 堆中劃分出來,並分配給對象。劃份內存的方式主要有兩種:併發
指針碰撞法函數
即假設 Java 堆中內存是絕對規整的,已被使用的內存放在一邊,空閒的內存放在另外一邊,中間有一個指針做爲分界點的指示器,那麼當須要分配內存時,只須要將指針向空閒空間的方向挪動一段與對象大小相等的距離便可佈局
空閒列表法線程
這個狀況就是 Java 堆中內存並非規整的,已使用內存和空閒內存相互交錯在一塊兒。此時虛擬機必須維護一個列表,記錄哪些內存塊可用,分配時從列表中找出一塊足夠大的空間劃分給對象實例,並更新列表記錄設計
因而可知,選擇哪一種分配方式由 Java 堆是否規整決定,而 Java 堆是否規整又由所採用的垃圾收集器是否帶有空間壓縮整理的能力決定指針
除了如何劃分可用空間之外,還有一個須要考慮的問題:對象建立在虛擬機中是很是頻繁的行爲,即便僅僅只是修改指針的位置,在併發狀況下也並非安全的,有可能出現正在給對象 A 分配內存,指針還沒來得及修改,對象 B 又同時使用原來的指針來分配內存。解決該問題的方法有兩個:一個是對分配內存空間的動做片進行同步處理,實際上虛擬機是採用 CAS 配上失敗重試機制來保證更新操做的原子性的;另外一種是把內存分配的動做按照線程劃分到不一樣的空間之中進行,即每一個線程在 Java 堆中預先分配一小塊內存,稱爲本地線程分配緩衝(Thread Local Allocation Buffer),簡稱 TLAB,哪一個線程要分配內存,就在哪一個線程的本地緩衝區中分配,只有本地緩衝區用完了,分配新的緩衝區時才須要同步鎖定。虛擬機是否使用 TLAB,能夠經過 -XX:+/UseTLAB 參數來設定對象
內存分配完成後,虛擬機必須先將分配到的內存空間(但不包括對象頭)都初始化爲零值,若是使用了 TLAB 的話,這項工做也能夠提早在 TLAB 分配時順便進行。這步操做保證了對象的實例字段在 Java 代碼中能夠不賦初值就直接使用,使程序能夠訪問到這些字段的數據類型對應的零值
接下來,Java 虛擬機還須要對對象的對象頭(Object Header)進行設置,對象頭存放一些信息如這個對象是哪一個對象的實例、如何找到類的元數據信息、對象的哈希碼、對象的 GC 分代年齡等
上面的工做完成以後,從虛擬機的視角來看,一個新的對象已經誕生了,而從 Java 程序的角度來看,對象的建立纔剛剛開始,對象的構造函數,即 Class 文件的 <init> 方法還沒有執行,全部的字段都是默認的零值。new 指令以後會接着執行 <init> 方法,對對象進行初始化,這樣一個真正可用的對象纔算徹底構造出來
在 HotSpot 虛擬機中,對象在堆內存中的存儲佈局能夠劃分爲三個部分:對象頭(Header)、實例數據(Instance Data)和對齊填充(Padding)
Hotspot 虛擬機對象的對象頭部分包括兩類信息,第一類是用於存儲對象自身的運行時數據,如哈希碼、GC 分代年齡、鎖狀態標誌、線程持有鎖、偏向線程 ID、編向時間戳等。這部分數據的長度在 32 位和 64 位虛擬機中分別爲 32 個比特和 64 個比特,官方稱之爲 「Mark Word」
但實際上,對象須要存儲待運行時數據不少,已經超過了 3二、64 位 Bitmap 結構所能記錄的最大限度,所以 Mark Word 被設計成一個有着動態定義的數據結構,以便儘量多的複用本身的存儲空間,例如在 32 位 JVM 中是這樣存儲的:
對象頭的另外一個部分是類型指針,即對象指向它的類型元數據的指針,Java 虛擬機經過這個指針來肯定這個對象是屬於哪一個類的實例。然而,並非全部的虛擬機都會在對象頭上保留類型指針,換句話說,查找對象的元數據信息不必定要通過對象自己。此外,若是對象是個數組,那麼在對象頭中還必須有一塊用於記錄數組長度的數據
實例數據部分是對象真正存儲的有效信息,即咱們在代碼裏面所定義的各類類型的字段內容,不管是從父類繼承下來的,仍是在子類中定義的字段都必須記錄起來
對齊填充並非必然存在的,它僅僅起着佔位符的做用,由於 Hotspot 虛擬機的自動內存管理機制要求對象的大小必須是 8 字節的整數倍。所以,若是對象實例數據部分沒有對齊的話,就須要經過對齊填充來補全
Java 程序會經過棧上的 reference 數據來操做堆上的具體對象。在 Java 虛擬機規範中,只是規定 reference 類型是一個指向對象的引用,並無定義要用什麼方式實現。所以對象訪問方式是由虛擬機自主實現的,主流的訪問方式主要有使用句柄和直接指針兩種:
句柄訪問
Java 堆中會劃分出一塊內存來做爲句柄池,reference 中存儲的就是對象的句柄地址,而句柄包含了對象實例數據和類型數據各自具體的地址信息
直接指針
reference 中存儲的就是對象地址,因此若是隻是訪問對象自己的話,能夠避免屢次開銷。另外,若是使用直接指針訪問,Java 堆中對象的內存佈局就必須考慮如何放置用於訪問類型數據的相關信息
兩種方式各有千秋,使用句柄的好處就是 reference 中存儲的是穩定的句柄地址,若是對象被移動(例如進行垃圾收集),那麼只會改變句柄中實例數據指針,而 reference 自己不須要修改。而使用直接指針的好處就是速度更快,節省時間開銷。在 HotSpot 虛擬機中主要使用直接指針方式進行對象訪問