JVM基礎面試題及原理講解

本文從 JVM 結構入手,介紹了 Java 內存管理、對象建立、常量池等基礎知識,對面試中 JVM 相關的基礎題目進行了講解。html

寫在前面(常見面試題)基本問題程序員

  • 介紹下 Java 內存區域(運行時數據區)
  • Java 對象的建立過程(五步,建議能默寫出來而且要知道每一步虛擬機作了什麼)
  • 對象的訪問定位的兩種方式(句柄和直接指針兩種方式)

拓展問題面試

  • String類和常量池
  • 8種基本類型的包裝類和常量池

1 概述算法

對於 Java 程序員來講,在虛擬機自動內存管理機制下,再也不須要像C/C++程序開發程序員這樣爲內一個 new 操做去寫對應的 delete/free 操做,不容易出現內存泄漏和內存溢出問題。正是由於 Java 程序員把內存控制權利交給 Java 虛擬機,一旦出現內存泄漏和溢出方面的問題,若是不瞭解虛擬機是怎樣使用內存的,那麼排查錯誤將會是一個很是艱鉅的任務。數組

2 運行時數據區域緩存

Java 虛擬機在執行 Java 程序的過程當中會把它管理的內存劃分紅若干個不一樣的數據區域。安全

這些組成部分一些是線程私有的,其餘的則是線程共享的。多線程

線程私有的:併發

  • 程序計數器
  • 虛擬機棧
  • 本地方法棧

線程共享的:函數

  • 方法區
  • 直接內存

2.1 程序計數器

程序計數器是一塊較小的內存空間,能夠看做是當前線程所執行的字節碼的行號指示器。字節碼解釋器工做時經過改變這個計數器的值來選取下一條須要執行的字節碼指令,分支、循環、跳轉、異常處理、線程恢復等功能都須要依賴這個計數器來完。

另外,爲了線程切換後能恢復到正確的執行位置,每條線程都須要有一個獨立的程序計數器,各線程之間計數器互不影響,獨立存儲,咱們稱這類內存區域爲「線程私有」的內存。

從上面的介紹中咱們知道程序計數器主要有兩個做用:

  • 字節碼解釋器經過改變程序計數器來依次讀取指令,從而實現代碼的流程控制,如:順序執行、選擇、循環、異常處理。
  • 在多線程的狀況下,程序計數器用於記錄當前線程執行的位置,從而當線程被切換回來的時候可以知道該線程上次運行到哪兒了。

注意:程序計數器是惟不會出現 OutOfMemoryError 的內存區域,它的生命週期隨着線程的建立而建立,隨着線程的結束而死亡。

2.2 Java 虛擬機棧

與程序計數器同樣,Java虛擬機棧也是線程私有的,它的生命週期和線程相同,描述的是 Java 方法執行的內存模型。

Java 內存能夠粗糙的區分爲堆內存(Heap)和棧內存(Stack)其中棧就是如今說的虛擬機棧,或者說是虛擬機棧中局部變量表部分。 (實際上,Java虛擬機棧是由一個個棧幀組成,而每一個棧幀中都擁有局部變量表、操做數棧、動態連接、方法出口信息)

局部變量表主要存放了編譯器可知的各類數據類型(boolean、byte、char、short、int、float、long、double)、對象引用(reference類型,它不一樣於對象自己,多是一個指向對象起始地址的引用指針,也多是指向一個表明對象的句柄或其餘與此對象相關的位置)。

Java 虛擬機棧會出現兩種異常:StackOverFlowError 和 OutOfMemoryError。

  • StackOverFlowError: 若Java虛擬機棧的內存大小不容許動態擴展,那麼當線程請求棧的深度超過當前Java虛擬機棧的最大深度的時候,就拋出StackOverFlowError異常。
  • OutOfMemoryError: 若 Java 虛擬機棧的內存大小容許動態擴展,且當線程請求棧時內存用完了,沒法再動態擴展了,此時拋出OutOfMemoryError異常。

Java 虛擬機棧也是線程私有的,每一個線程都有各自的Java虛擬機棧,並且隨着線程的建立而建立,隨着線程的死亡而死亡。

2.3 本地方法棧

和虛擬機棧所發揮的做用很是類似,區別是: 虛擬機棧爲虛擬機執行 Java 方法 (也就是字節碼)服務,而本地方法棧則爲虛擬機使用到的 Native 方法服務。 在 HotSpot 虛擬機中和 Java 虛擬機棧合二爲一。

本地方法被執行的時候,在本地方法棧也會建立一個棧幀,用於存放該本地方法的局部變量表、操做數棧、動態連接、出口信息。

方法執行完畢後相應的棧幀也會出棧並釋放內存空間,也會出現 StackOverFlowError 和 OutOfMemoryError 兩種異常。

2.4 堆

Java 虛擬機所管理的內存中最大的一塊,Java 堆是全部線程共享的一塊內存區域,在虛擬機啓動時建立。此內存區域的惟一目的就是存放對象實例,幾乎全部的對象實例以及數組都在這裏分配內存。

Java 堆是垃圾收集器管理的主要區域,所以也被稱做GC堆(Garbage Collected Heap).從垃圾回收的角度,因爲如今收集器基本都採用分代垃圾收集算法,因此Java堆還能夠細分爲:新生代和老年代:再細緻一點有:Eden空間、From Survivor、To Survivor空間等。進一步劃分的目的是更好地回收內存,或者更快地分配內存。

在 JDK 1.8中移除整個永久代,取而代之的是一個叫元空間(Metaspace)的區域(永久代使用的是JVM的堆內存空間,而元空間使用的是物理內存,直接受到本機的物理內存限制)。

推薦閱讀:Java8內存模型——永久代(PermGen)和元空間(Metaspace)

2.5 方法區

方法區與 Java 堆同樣,是各個線程共享的內存區域,它用於存儲已被虛擬機加載的類信息、常量、靜態變量、即時編譯器編譯後的代碼等數據。雖然Java虛擬機規範把方法區描述爲堆的一個邏輯部分,可是它卻有一個別名叫作 Non-Heap(非堆),目的應該是與 Java 堆區分開來。

HotSpot 虛擬機中方法區也常被稱爲 「永久代」,本質上二者並不等價。僅僅是由於 HotSpot 虛擬機設計團隊用永久代來實現方法區而已,這樣 HotSpot 虛擬機的垃圾收集器就能夠像管理 Java 堆同樣管理這部份內存了。可是這並非一個好主意,由於這樣更容易遇到內存溢出問題。

相對而言,垃圾收集行爲在這個區域是比較少出現的,但並不是數據進入方法區後就「永久存在」了。

2.6 運行時常量池

運行時常量池是方法區的一部分。Class 文件中除了有類的版本、字段、方法、接口等描述信息外,還有常量池信息(用於存放編譯期生成的各類字面量和符號引用)

既然運行時常量池時方法區的一部分,天然受到方法區內存的限制,當常量池沒法再申請到內存時會拋出 OutOfMemoryError 異常。

JDK1.7及以後版本的 JVM 已經將運行時常量池從方法區中移了出來,在 Java 堆(Heap)中開闢了一塊區域存放運行時常量池。

推薦閱讀:Java 中幾種常量池的區分

2.7 直接內存

直接內存並非虛擬機運行時數據區的一部分,也不是虛擬機規範中定義的內存區域,可是這部份內存也被頻繁地使用。並且也可能致使OutOfMemoryError異常出現。

JDK1.4中新加入的 NIO(New Input/Output) 類,引入了一種基於通道(Channel) 與緩存區(Buffer) 的 I/O 方式,它能夠直接使用Native函數庫直接分配堆外內存,而後經過一個存儲在 Java 堆中的 DirectByteBuffer 對象做爲這塊內存的引用進行操做。這樣就能在一些場景中顯著提升性能,由於避免了在 Java 堆和 Native 堆之間來回複製數據。

本機直接內存的分配不會收到 Java 堆的限制,可是,既然是內存就會受到本機總內存大小以及處理器尋址空間的限制。

3 HotSpot 虛擬機對象探祕

經過上面的介紹咱們大概知道了虛擬機的內存狀況,下面咱們來詳細的瞭解一下 HotSpot 虛擬機在 Java 堆中對象分配、佈局和訪問的全過程。

3.1 對象的建立

下圖即是 Java 對象的建立過程,我建議最好是能默寫出來,而且要掌握每一步在作什麼。

Java建立對象過程

1.類加載檢查:虛擬機遇到一條 new 指令時,首先將去檢查這個指令的參數是否能在常量池中定位到這個類的符號引用,而且檢查這個符號引用表明的類是否已被加載過、解析和初始化過。若是沒有,那必須先執行相應的類加載過程。

2.分配內存:在類加載檢查經過後,接下來虛擬機將爲新生對象分配內存。對象所需的內存大小在類加載完成後即可肯定,爲對象分配空間的任務等同於把一塊肯定大小的內存從 Java 堆中劃分出來。分配方式有 「指針碰撞」 和 「空閒列表」 兩種,選擇那種分配方式由 Java 堆是否規整決定,而Java堆是否規整又由所採用的垃圾收集器是否帶有壓縮整理功能決定。

內存分配的兩種方式:(補充內容,須要掌握)

選擇以上兩種方式中的哪種,取決於 Java 堆內存是否規整。而 Java 堆內存是否規整,取決於 GC 收集器的算法是」標記-清除」,仍是」標記-整理」(也稱做」標記-壓縮」),值得注意的是,複製算法內存也是規整的。

內存分配併發問題(補充內容,須要掌握)

在建立對象的時候有一個很重要的問題,就是線程安全,由於在實際開發過程當中,建立對象是很頻繁的事情,做爲虛擬機來講,必需要保證線程是安全的,一般來說,虛擬機採用兩種方式來保證線程安全:

  • CAS+失敗重試:CAS 是樂觀鎖的一種實現方式。所謂樂觀鎖就是,每次不加鎖而是假設沒有衝突而去完成某項操做,若是由於衝突失敗就重試,直到成功爲止。虛擬機採用 CAS 配上失敗重試的方式保證更新操做的原子性。
  • TLAB:爲每個線程預先在 Eden 區分配一塊內存。JVM 在給線程中的對象分配內存時,首先在 TLAB 分配,當對象大於TLAB 中的剩餘內存或 TLAB 的內存已用盡時,再採用上述的 CAS 進行內存分配。

3.初始化零值:內存分配完成後,虛擬機須要將分配到的內存空間都初始化爲零值(不包括對象頭),這一步操做保證了對象的實例字段在 Java 代碼中能夠不賦初始值就直接使用,程序能訪問到這些字段的數據類型所對應的零值。

4.設置對象頭:初始化零值完成以後,虛擬機要對對象進行必要的設置,例如這個對象是那個類的實例、如何才能找到類的元數據信息、對象的哈希嗎、對象的 GC 分代年齡等信息。 這些信息存放在對象頭中。 另外,根據虛擬機當前運行狀態的不一樣,如是否啓用偏向鎖等,對象頭會有不一樣的設置方式。

5.執行 init 方法:在上面工做都完成以後,從虛擬機的視角來看,一個新的對象已經產生了,但從 Java 程序的視角來看,對象建立纔剛開始,<init> 方法尚未執行,全部的字段都還爲零。因此通常來講,執行 new 指令以後會接着執行 <init> 方法,把對象按照程序員的意願進行初始化,這樣一個真正可用的對象纔算徹底產生出來。

3.2 對象的內存佈局

在 Hotspot 虛擬機中,對象在內存中的佈局能夠分爲3塊區域:對象頭、實例數據和對齊填充。

Hotspot虛擬機的對象頭包括兩部分信息,第一部分用於存儲對象自身的自身運行時數據(哈希碼、GC分代年齡、鎖狀態標誌等等),另外一部分是類型指針,即對象指向它的類元數據的指針,虛擬機經過這個指針來肯定這個對象是那個類的實例。

實例數據部分是對象真正存儲的有效信息,也是在程序中所定義的各類類型的字段內容。

對齊填充部分不是必然存在的,也沒有什麼特別的含義,僅僅起佔位做用。 由於 Hotspot 虛擬機的自動內存管理系統要求對象起始地址必須是8字節的整數倍,換句話說就是對象的大小必須是8字節的整數倍。而對象頭部分正好是8字節的倍數(1倍或2倍),所以,當對象實例數據部分沒有對齊時,就須要經過對齊填充來補全。

3.3 對象的訪問定位

創建對象就是爲了使用對象,咱們的Java程序經過棧上的 reference 數據來操做堆上的具體對象。對象的訪問方式有虛擬機實現而定,目前主流的訪問方式有使用句柄和直接指針兩種:

1.句柄:若是使用句柄的話,那麼 Java 堆中將會劃分出一塊內存來做爲句柄池,reference 中存儲的就是對象的句柄地址,而句柄中包含了對象實例數據與類型數據各自的具體地址信息。

2.直接指針:若是使用直接指針訪問,那麼 Java 堆對象的佈局中就必須考慮如何放置訪問類型數據的相關信息,而 reference 中存儲的直接就是對象的地址。

經過直接指針訪問對象

這兩種對象訪問方式各有優點。使用句柄來訪問的最大好處是 reference 中存儲的是穩定的句柄地址,在對象被移動時只會改變句柄中的實例數據指針,而 reference 自己不須要修改。使用直接指針訪問方式最大的好處就是速度快,它節省了一次指針定位的時間開銷

原文出處:http://www.importnew.com/3112...

相關文章
相關標籤/搜索