「深刻Java虛擬機(1)」:Java內存區域與內存溢出

內存區域

Java虛擬機在執行Java程序的過程當中會把他所管理的內存劃分爲若干個不一樣的數據區域。Java虛擬機規範將JVM所管理的內存分爲如下幾個運行時數據區:程序計數器、Java虛擬機棧、本地方法棧、Java堆、方法區。下面詳細闡述各數據區所存儲的數據類型。java

程序計數器(Program Counter Register)編程

一塊較小的內存空間,它是當前線程所執行的字節碼的行號指示器,字節碼解釋器工做時經過改變該計數器的值來選擇下一條須要執行的字節碼指令,分支、跳轉、循環等基礎功能都要依賴它來實現。每條線程都有一個獨立的的程序計數器,各線程間的計數器互不影響,所以該區域是線程私有的。數組

當線程在執行一個Java方法時,該計數器記錄的是正在執行的虛擬機字節碼指令的地址,當線程在執行的是Native方法(調用本地操做系統方法)時,該計數器的值爲空。另外,該內存區域是惟一一個在Java虛擬機規範中麼有規定任何OOM(內存溢出:OutOfMemoryError)狀況的區域。網絡

Java虛擬機棧(Java Virtual Machine Stacks)數據結構

該區域也是線程私有的,它的生命週期也與線程相同。虛擬機棧描述的是Java方法執行的內存模型:每一個方法被執行的時候都會同時建立一個棧幀,棧它是用於支持續虛擬機進行方法調用和方法執行的數據結構。對於執行引擎來說,活動線程中,只有棧頂的棧幀是有效的,稱爲當前棧幀,這個棧幀所關聯的方法稱爲當前方法,執行引擎所運行的全部字節碼指令都只針對當前棧幀進行操做。棧幀用於存儲局部變量表、操做數棧、動態連接、方法返回地址和一些額外的附加信息。在編譯程序代碼時,棧幀中須要多大的局部變量表、多深的操做數棧都已經徹底肯定了,而且寫入了方法表的Code屬性之中。所以,一個棧幀須要分配多少內存,不會受到程序運行期變量數據的影響,而僅僅取決於具體的虛擬機實現。多線程

在Java虛擬機規範中,對這個區域規定了兩種異常狀況:性能

一、若是線程請求的棧深度大於虛擬機所容許的深度,將拋出StackOverflowError異常。this

二、若是虛擬機在動態擴展棧時沒法申請到足夠的內存空間,則拋出OutOfMemoryError異常。spa

這兩種狀況存在着一些互相重疊的地方:當棧空間沒法繼續分配時,究竟是內存過小,仍是已使用的棧空間太大,其本質上只是對同一件事情的兩種描述而已。在單線程的操做中,不管是因爲棧幀太大,仍是虛擬機棧空間過小,當棧空間沒法分配時,虛擬機拋出的都是StackOverflowError異常,而不會獲得OutOfMemoryError異常。而在多線程環境下,則會拋出OutOfMemoryError異常。操作系統

下面詳細說明棧幀中所存放的各部分信息的做用和數據結構。

一、局部變量表

局部變量表是一組變量值存儲空間,用於存放方法參數和方法內部定義的局部變量,其中存放的數據的類型是編譯期可知的各類基本數據類型、對象引用(reference)和returnAddress類型(它指向了一條字節碼指令的地址)。局部變量表所需的內存空間在編譯期間完成分配,即在Java程序被編譯成Class文件時,就肯定了所需分配的最大局部變量表的容量。當進入一個方法時,這個方法須要在棧中分配多大的局部變量空間是徹底肯定的,在方法運行期間不會改變局部變量表的大小。

局部變量表的容量以變量槽(Slot)爲最小單位。在虛擬機規範中並無明確指明一個Slot應占用的內存空間大小(容許其隨着處理器、操做系統或虛擬機的不一樣而發生變化),一個Slot能夠存放一個32位之內的數據類型:boolean、byte、char、short、int、float、reference和returnAddresss。reference是對象的引用類型,returnAddress是爲字節指令服務的,它執行了一條字節碼指令的地址。對於64位的數據類型(long和double),虛擬機會以高位在前的方式爲其分配兩個連續的Slot空間。

虛擬機經過索引定位的方式使用局部變量表,索引值的範圍是從0開始到局部變量表最大的Slot數量,對於32位數據類型的變量,索引n表明第n個Slot,對於64位的,索引n表明第n和第n+1兩個Slot。

在方法執行時,虛擬機是使用局部變量表來完成參數值到參數變量列表的傳遞過程的,若是是實例方法(非static),則局部變量表中的第0位索引的Slot默認是用於傳遞方法所屬對象實例的引用,在方法中能夠經過關鍵字「this」來訪問這個隱含的參數。其他參數則按照參數表的順序來排列,佔用從1開始的局部變量Slot,參數表分配完畢後,再根據方法體內部定義的變量順序和做用域分配其他的Slot。

局部變量表中的Slot是可重用的,方法體中定義的變量,做用域並不必定會覆蓋整個方法體,若是當前字節碼PC計數器的值已經超過了某個變量的做用域,那麼這個變量對應的Slot就能夠交給其餘變量使用。這樣的設計不只僅是爲了節省空間,在某些狀況下Slot的複用會直接影響到系統的而垃圾收集行爲。

二、操做數棧

操做數棧又常被稱爲操做棧,操做數棧的最大深度也是在編譯的時候就肯定了。32位數據類型所佔的棧容量爲1,64爲數據類型所佔的棧容量爲2。當一個方法開始執行時,它的操做棧是空的,在方法的執行過程當中,會有各類字節碼指令(好比:加操做、賦值元算等)向操做棧中寫入和提取內容,也就是入棧和出棧操做。

Java虛擬機的解釋執行引擎稱爲「基於棧的執行引擎」,其中所指的「棧」就是操做數棧。所以咱們也稱Java虛擬機是基於棧的,這點不一樣於Android虛擬機,Android虛擬機是基於寄存器的。

基於棧的指令集最主要的優勢是可移植性強,主要的缺點是執行速度相對會慢些;而因爲寄存器由硬件直接提供,因此基於寄存器指令集最主要的優勢是執行速度快,主要的缺點是可移植性差。

三、動態鏈接

每一個棧幀都包含一個指向運行時常量池(在方法區中,後面介紹)中該棧幀所屬方法的引用,持有這個引用是爲了支持方法調用過程當中的動態鏈接。Class文件的常量池中存在有大量的符號引用,字節碼中的方法調用指令就以常量池中指向方法的符號引用爲參數。這些符號引用,一部分會在類加載階段或第一次使用的時候轉化爲直接引用(如final、static域等),稱爲靜態解析,另外一部分將在每一次的運行期間轉化爲直接引用,這部分稱爲動態鏈接。

四、方法返回地址

當一個方法被執行後,有兩種方式退出該方法:執行引擎遇到了任意一個方法返回的字節碼指令或遇到了異常,而且該異常沒有在方法體內獲得處理。不管採用何種退出方式,在方法退出以後,都須要返回到方法被調用的位置,程序才能繼續執行。方法返回時可能須要在棧幀中保存一些信息,用來幫助恢復它的上層方法的執行狀態。通常來講,方法正常退出時,調用者的PC計數器的值就能夠做爲返回地址,棧幀中極可能保存了這個計數器值,而方法異常退出時,返回地址是要經過異常處理器來肯定的,棧幀中通常不會保存這部分信息。

方法退出的過程實際上等同於把當前棧幀出站,所以退出時可能執行的操做有:恢復上層方法的局部變量表和操做數棧,若是有返回值,則把它壓入調用者棧幀的操做數棧中,調整PC計數器的值以指向方法調用指令後面的一條指令。

本地方法棧(Native Method Stacks)

該區域與虛擬機棧所發揮的做用很是類似,只是虛擬機棧爲虛擬機執行Java方法服務,而本地方法棧則爲使用到的本地操做系統(Native)方法服務。

Java堆(Java Heap)

Java Heap是Java虛擬機所管理的內存中最大的一塊,它是全部線程共享的一塊內存區域。幾乎全部的對象實例和數組都在這類分配內存。Java Heap是垃圾收集器管理的主要區域,所以不少時候也被稱爲「GC堆」。

根據Java虛擬機規範的規定,Java堆能夠處在物理上不連續的內存空間中,只要邏輯上是連續的便可。若是在堆中沒有內存可分配時,而且堆也沒法擴展時,將會拋出OutOfMemoryError異常。

方法區(Method Area)

方法區也是各個線程共享的內存區域,它用於存儲已經被虛擬機加載的類信息、常量、靜態變量、即時編譯器編譯後的代碼等數據。方法區域又被稱爲「永久代」,但這僅僅對於Sun HotSpot來說,JRockit和IBM J9虛擬機中並不存在永久代的概念。Java虛擬機規範把方法區描述爲Java堆的一個邏輯部分,並且它和Java Heap同樣不須要連續的內存,能夠選擇固定大小或可擴展,另外,虛擬機規範容許該區域能夠選擇不實現垃圾回收。相對而言,垃圾收集行爲在這個區域比較少出現。該區域的內存回收目標主要針是對廢棄常量的和無用類的回收。運行時常量池是方法區的一部分,Class文件中除了有類的版本、字段、方法、接口等描述信息外,還有一項信息是常量池(Class文件常量池),用於存放編譯器生成的各類字面量和符號引用,這部份內容將在類加載後存放到方法區的運行時常量池中。運行時常量池相對於Class文件常量池的另外一個重要特徵是具有動態性,Java語言並不要求常量必定只能在編譯期產生,也就是並不是預置入Class文件中的常量池的內容才能進入方法區的運行時常量池,運行期間也可能將新的常量放入池中,這種特性被開發人員利用比較多的是String類的intern()方法。

根據Java虛擬機規範的規定,當方法區沒法知足內存分配需求時,將拋出OutOfMemoryError異常。

直接內存(Direct Memory)

直接內存並非虛擬機運行時數據區的一部分,也不是Java虛擬機規範中定義的內存區域,它直接從操做系統中分配,所以不受Java堆大小的限制,可是會受到本機總內存的大小及處理器尋址空間的限制,所以它也可能致使OutOfMemoryError異常出現。在JDK1.4中新引入了NIO機制,它是一種基於通道與緩衝區的新I/O方式,能夠直接從操做系統中分配直接內存,即在堆外分配內存,這樣能在一些場景中提升性能,由於避免了在Java堆和Native堆中來回複製數據。關於NIO的詳細使用能夠參考個人Java網絡編程系列中關於NIO的相關文章

內存溢出

這裏有一點要重點說明,在多線程狀況下,給每一個線程的棧分配的內存越大,反而越容易產生內存溢出異常。操做系統爲每一個進程分配的內存是有限制的,虛擬機提供了參數來控制Java堆和方法區這兩部份內存的最大值,忽略掉程序計數器消耗的內存(很小),以及進程自己消耗的內存,剩下的內存便給了虛擬機棧和本地方法棧,每一個線程分配到的棧容量越大,能夠創建的線程數量天然就越少。所以,若是是創建過多的線程致使的內存溢出,在不能減小線程數的狀況下,就只能經過減小最大堆和每一個線程的棧容量來換取更多的線程。

另外,因爲Java堆內也可能發生內存泄露(Memory Leak),這裏簡要說明一下內存泄露和內存溢出的區別:

內存泄露是指分配出去的內存沒有被回收回來,因爲失去了對該內存區域的控制,於是形成了資源的浪費。Java中通常不會產生內存泄露,由於有垃圾回收器自動回收垃圾,但這也不絕對,當咱們new了對象,並保存了其引用,可是後面一直沒用它,而垃圾回收器又不會去回收它,這邊會形成內存泄露,

內存溢出是指程序所須要的內存超出了系統所能分配的內存(包括動態擴展)的上限。

對象實例化分析

對內存分配狀況分析最多見的示例即是對象實例化:

Object obj = new Object();

這段代碼的執行會涉及java棧、Java堆、方法區三個最重要的內存區域。假設該語句出如今方法體中,及時對JVM虛擬機不瞭解的Java使用這,應該也知道obj會做爲引用類型(reference)的數據保存在Java棧的本地變量表中,而會在Java堆中保存該引用的實例化對象,但可能並不知道,Java堆中還必須包含能查找到此對象類型數據的地址信息(如對象類型、父類、實現的接口、方法等),這些類型數據則保存在方法區中。

另外,因爲reference類型在Java虛擬機規範裏面只規定了一個指向對象的引用,並無定義這個引用應該經過哪一種方式去定位,以及訪問到Java堆中的對象的具體位置,所以不一樣虛擬機實現的對象訪問方式會有所不一樣,主流的訪問方式有兩種:使用句柄池和直接使用指針。

這兩種對象的訪問方式各有優點,使用句柄訪問方式的最大好處就是reference中存放的是穩定的句柄地址,在對象唄移動(垃圾收集時移動對象是很是廣泛的行爲)時只會改變句柄中的實例數據指針,而reference自己不須要修改。使用直接指針訪問方式的最大好處是速度快,它節省了一次指針定位的時間開銷。目前Java默認使用的HotSpot虛擬機採用的即是是第二種方式進行對象訪問的。

相關文章
相關標籤/搜索