Java虛擬機之因此被稱之爲是虛擬的,就是由於它僅僅是由一個規範來定義的抽象計算機。所以,要運行某個Java程序,首先須要一個符合該規範的具體實現。java
一個運行時的Java虛擬機實例的天職就是:負責運行一個Java程序。當啓動一個Java程序時,一個虛擬機實例就誕生了。當該程序關閉退出,這個虛擬機實例也就隨之消亡。每一個Java程序都運行於它本身的Java虛擬機實例中。程序員
Java虛擬機實例經過調用某個初始類的main()方法來運行一個Java程序。而這個main()方法必須是共有的public、靜態的static、返回值爲void,而且接受一個字符串數組做爲參數。任何擁有這樣一個main()方法的類均可以做爲Java程序運行的起點。算法
好比,考慮這樣一個Java程序,它打印出傳給它的命令行參數:數據庫
Class Echo{數組
Public static void main(String[] args){安全
Int len = args.length;數據結構
For(int i = 0; i < len; ++i){多線程
System.out.print(args[i] + 「 」);數據結構和算法
}函數
System.out.println();
}
}
必須告訴Java虛擬機要運行的Java程序中初始類的名字,這個程序將從它的main()方法開始運行。如在Windows上使用命令:
Java Echo Greetings, Planet.
Java程序初始類中的main()方法,經做爲該程序初始線程的起點,任何其餘的線程都是由這個線程啓動的。
在Java虛擬機內部有兩種線程:守護線程和非守護線程。守護線程一般是由虛擬機本身用的,好比執行垃圾收集任務的線程。可是,Java程序也能夠把它建立的任何線程標記爲守護線程。而Java程序中的初始線程---就是開始於main()的那個,是非守護線程。
只要還有任何非守護線程在運行,那麼這個Java程序也在繼續運行(虛擬機仍然存活)。當該程序全部的非守護線程都終止時,虛擬機實例將自動退出。倘若安全管理器運行,程序自己也可以經過調用Runtime類或者System類的exit()方法退出。
在Java虛擬機規範中,一個虛擬機實例的行爲是分別按照子系統、內存區、數據類型以及指令這幾個術語來描述的。
下圖爲Java虛擬機的結構框圖,包括在規範中描述的主要子系統和內存區。前面提到,每一個Java虛擬機都有一個類裝載器子系統,它根據給定的全限定名來裝入類型。一樣,每一個Java虛擬機都有一個執行引擎,它負責執行那些包含在被裝載類的方法中的指令。
當Java虛擬機運做一個程序時,它須要內存來存儲許多東西,例如,字節碼,從已裝載的class文件中獲得的其餘信息,程序建立的對象、傳遞給方法的參數、返回值、局部變量以及運算的中間結果等,Java虛擬機把這些東西都組織到幾個「運行時數據區」中,以便於管理。Java虛擬機規範對「運行時數據區」的描述是抽象的,由具體實現的設計者決定。
某些運行時數據區是由程序中全部線程共享的,還有一些則只能由一個線程擁有。每一個Java虛擬機實例都有一個方法區以及一個堆,它們是由該虛擬機實例中全部線程共享的。當虛擬機裝載一個class文件時,它會從這個class文件包含的二進制數據中解析類型信息。而後,它把這些類型信息放到方法區中。當程序運行時,虛擬機會把全部該程序在運行時建立的對象都放到堆中。
當每個新線程被建立時,它都將獲得它本身的PC寄存器(程序計數器)以及一個Java棧:若是線程正在執行的是一個Java方法(非本地方法),那麼PC寄存器的值將老是指示下一條將被執行的指令,而它的Java棧則老是存儲該線程中Java方法調用的裝載---包括它的局部變量,被調用時傳進來的參數,它的返回值,以及運算的中間結果等。而本地方法調用的狀態,則是以某種依賴於具體實現的方式存儲在本地方法棧中,也多是在寄存器或者其餘某些與特定實現相關的內存中。
Java棧是由許多棧幀(stack frame)或幀(frame)組成的,一個棧幀包含一個Java方法調用的狀態。當線程調用一個Java方法時,虛擬機壓入一個新的棧幀到該線程的Java棧中,當該方法返回時,這個棧幀從Java棧中彈出。
Java虛擬機沒有寄存器,其指令集使用Java棧來存儲中間數據。這樣設計的緣由是爲了保持Java虛擬機的指令集儘可能緊湊,同時也便於Java虛擬機在那些只有不多通用寄存器的平臺上實現。另外Java虛擬機的這種基於棧的體系結構也有助於運行時某些虛擬機實現的動態編譯器和即時編譯器的代碼優化。
下圖描繪了Java虛擬機爲每個線程建立的內存區,這些內存區域是私有的,任何線程都不能訪問另外一個線程的PC寄存器或者Java棧。
Java虛擬機是經過某些數據類型來執行計算的,數據類型及其運算都是由Java虛擬機規範嚴格定義的,數據類型能夠分爲兩種:基本類型和引用類型。基本類型的變量持有原始值,而引用類型的變量持有引用值。術語「引用值」指的是對某個對象的引用,而不是該對象的自己,與此相對,原始值則是真正的原始數據。
Java語言中的全部基本類型一樣也都是Java虛擬機中的基本類型。可是boolean有點特別,雖然Java虛擬機也把boolean看作基本類型,可是指令集對boolean只有頗有限的支持。當編譯器把Java源碼編譯爲字節碼時,它會用int或byte來表示boolean。在Java虛擬機中,false是由整數零來表示的,全部非零整數都表示true,涉及boolean值的操做則會使用int。另外,boolean數組是當作byte數組來訪問的,可是在「堆」區,它也能夠被表示爲位域。
Java虛擬機中還有一個只在內部使用的基本類型:returnAddress,Java程序猿不能使用這個類型,這個基本類型被用來實現Java程序的finally字句。
Java虛擬機的引用類型被統稱爲「引用」(reference),有三種引用類型:類類型、接口類型以及數組類型,它們的值都是對動態建立對象的引用。類類型的值是對類實例的引用;數組類型的值是對數組對象的引用,在Java虛擬機中,數組是個真正的對象;而接口類型的值,則是對實現了該接口的某個類實例的引用。
Java虛擬機規範定義了每一種數據類型的取值範圍,可是卻沒有定義它們的位寬。位寬由具體的虛擬機實現設計者決定。
Java虛擬機中,最基本的數據單元就是字,它的大小是由每一個虛擬機實現的設計者來決定的。字長必須足夠大,至少是一個字單元就足以持有byte、short、int、char、float、returnAddress或者reference類型的值,而兩個字單元就足以持有long或者double類型的值。所以,虛擬機實現的設計者至少得選擇32位做爲字長,或者選擇更爲高效的字長大小。一般根據底層主機平臺的指針長度來選擇字長。
在Java虛擬機規範中,關於運行時數據區的大部份內容,都是基於「字」這個抽象概念的。好比,關於棧幀的兩個部分---局部變量和操做數棧---都是按照「字」來定義的。這些內存區可以容納任何虛擬機數據類型的值,當把這些值放到局部變量或者操做數棧中時,它將佔用一個或兩個字單元。
在運行時,Java程序沒法偵測到底層虛擬機的字長大小;一樣,虛擬機的字長大小也不會影響程序的行爲---它僅僅是虛擬機實現的內部屬性。
在Java虛擬機中,負責查找並裝載類型的那部分被稱爲類裝載子系統。
Java虛擬機有兩種類裝載器:啓動類裝載器和用戶自定義類裝載器。前者是Java虛擬機實現的一部分,後者則是Java程序的一部分。由不一樣的類裝載器裝載的類將被放在虛擬機內部的不一樣命名空間中。
類裝載子系統涉及Java虛擬機的其餘幾個組成部分,以及幾個來自java.lang庫的類。好比,用戶自定義的類裝載器是普通的Java對象,它的類必須派生自java.lang.ClassLoader類。ClassLoader中定義的方法爲程序提供了訪問類裝載器機制的接口。此外,對於每個被裝載的類型,Java虛擬機都會爲它建立一個java.lang.Class類的實例來表明該類型。和全部其餘對象同樣,用戶自定義的類裝載器以及Class類的實例都放在內存中的堆區,而裝載的類型信息則都位於方法區。
裝載、鏈接以及初始化 類裝載子系統除了要定位和導入二進制class文件外,還必須負責驗證被導入類的正確性,爲類變量分配並初始化內存,以及幫助解析符號引用。這些動做必須嚴格按如下順序進行:
一、裝載---查找並裝載類型的二進制數據
二、鏈接---執行驗證,準備,以及解析
驗證---確保被導入類型的正確性
準備--爲類變量分配內存,並將其初始化爲默認值
解析---把類型中的符號引用轉換爲直接引用
三、初始化---把類變量初始化爲正確初始值
啓動類裝載器 只要是符合Java class文件格式的二進制文件,Java虛擬機實現都必須可以從中辨別並裝載其中的類和接口。某些虛擬機實現也能夠識別其餘的非規範的二進制格式文件,但它必須可以辨別class文件。
每一個Java虛擬機實現都必須有一個啓動類裝載器,它知道怎麼裝載受信任的類,好比Java API的class文件。Java虛擬機規範並未規定啓動類裝載器如何去尋找class文件。
只要給定某個類型的全限定名,啓動類裝載器就必須可以以某種方法獲得定義該類型的數據。在JDK1.2中,啓動類裝載器只在系統類(Java API的類文件)的安裝路徑中查找要裝入的類;而搜索CLASSPATH目錄的任務,如今交給了系統類裝載器---它是一個自定義的類裝載器,當虛擬機啓動時就被自動建立。
用戶自定義類裝載器 儘管「用戶自定義類裝載器」自己是Java程序的一部分,但類ClassLoader中的四個方法是通往Java虛擬機的通道:
protected final class defineClass(String name, byte data[], int offset, int length)
protected final class defineClass(String name, byte data[], int offset, int length, ProtectionDomain protectionDomain)
protected final Class findSystemClass(String name);
protected final void resolveClass(Class c);
任何Java虛擬機實現都必須把這些方法鏈接到內部的類裝載器子系統中。
兩個被重載的defineClass()方法都要接受一個名爲data[]的字節數組做爲輸入參數,而且在data[offset]到data[offset+length]之間的二進制數據必須符合Java class文件格式---它表示一個新的可用類型。而name參數是個字符串,它給出指定類型的全限定名。使用第一個defineClass()時,該類型被賦以默認的保護域,使用第二個時該類型的保護域由它的protectionDomain參數指定。每一個Java虛擬機實現都必須保證ClassLoader類的defineClass()方法可以把新類型導入到方法區中。
findSystemClass()方法接受一個字符串做爲參數,它指出被裝入類型的全限定名。在版本1.2中,該方法使用系統類裝載器來裝載指定類型。任何Java虛擬機實現都必須保證findSystemClass()方法可以以這種方式調用系統類裝載器。
resolveClass()方法接受一個Class實例的引用做爲參數,它將對該Class實例表示的類型執行鏈接動做。而defineClass()方法則只負責裝載。當defineClass方法返回一個Class實例時,也就表示指定的class文件已經被找到並裝載到方法區了,可是卻不必定被鏈接和初始化了。Java虛擬機實現必須保證ClassLoader類的resolveClass方法可以讓類裝載器子系統執行鏈接動做。
命名空間 每個類裝載器都有本身的命名空間,其中維護着由它裝載的類型。一個Java程序能夠屢次裝載具備同一個全限定名的多個類型,當多個類裝載器都裝載了同名的類型時,爲了惟一地標識該類型,還要在類型名稱前加上裝載該類型的類裝載器的標識。
Java虛擬機中的命名空間,實際上是解析過程的結果。對於每個被裝載的類型,Java虛擬機都會記錄裝載它的類裝載器。當虛擬機解析一個類到另外一個類的符號引用時,它須要被引用類的類裝載器。
在Java虛擬機中,關於被裝載類型的信息存儲在一個邏輯上被稱爲方法區的內存中。當虛擬機裝載某個類型時,它使用類裝載器定位相應的class文件,而後讀人這個class文件---一個線性二進制數據流---而後將它傳輸到虛擬機中、.緊接着虛擬機提取其中的類型信息,並將這些信息存儲到方法區。該類型中的類(靜態)變量一樣也是存儲在方法區。Java虛擬機在內部如何存儲類型信息,這是由具體實現的設計者來決定的。
當虛擬機運行Java程序時,它會查找使用存儲在方法區中的類型信息。設計其應當爲類型信息的內部表示設計適當的數據結構,以儘量在保持虛擬機小巧緊湊的同時加快程序的運行效率。若是正在設計一個須要在少許內存的限制中操做的實現,設計者可能會決定以犧牲某些運行速度來換取緊湊性。另一方面,若是設計一個將在虛擬內存系統中運行的實現,設計者可能會決定在方法區中保存一些冗餘倍息,以此來加快執行速度。(若是底層主機沒有提供虛擬內存,可是提供了一個硬盤,設計者可能會在實現中建立一個虛擬內存系統。Java虛擬機的設計者能夠根據目標平臺的資源限制和需求,在空問和時間上作出權衡.選擇實現什麼樣的數據結構和數據組織。
因爲全部線程都共享方法區,所以它們對方法區數據的訪問必須被設計爲是線程安全的。好比,假設同時有兩個線程都企圖訪問一個名爲Lava的類,而這個類尚未被裝人虛擬機,那麼,這時只應該有一個線程去裝載它,而另外一個線程則只能等待。方法區的大小沒必要是固定的,虛擬機能夠根據應用的須要動態調整。一樣,方法區也沒必要是連續的,方法區能夠在一個堆(甚至是虛擬機本身的堆)中自由分配。另外,虛擬機也能夠容許用戶或者程序員指定方法區的初始大小以及最小和最大尺寸等。
方法區也能夠被垃圾收集,由於虛擬機容許經過用戶定義的類裝載器來動態擴展Java程序,所以一些類也會成爲程序「再也不引用」的類。當某個類變爲再也不被引用的類時,Java虛擬機能夠卸載這個類(垃圾收集)從而使方法區佔據的內存保持最小。
類型信息 對每一個裝栽的類型,虛擬機都會在方法區中存儲如下類型信息:
•這個類型的全限定名。
•這個類型的直接超類的全限定名(除非這個類型是java.lang.Object,它沒有超類)
•這個類型是類類型仍是接口類型
•這個類型的訪問修飾符(public、abstract或final的某個子集)
•任何直接超接口的全限定名的有序列表。
在Java class文件和虛擬機中,類型名老是以全限定名出如今Java源代媽中,全限定名由類所屬包的名稱加一個再加一個「.」,再加上類名組成。例如,類Object的所屬包爲java.lang,那它的全限定名應該是java.lang.Object,但在class文件裏,全部的「.」都被斜槓「/」代替.這樣就成爲java/lang/Objectc。至於全限定名在方法區中的表示,則因不一樣的設計者有不一樣的選擇而不一樣,能夠用任何形式和數據結構來表明。
除了上面列出的基本類型息外,虛擬機還得爲每一個被裝載的類型存儲如下信息:
•該類型的常量池。
•字段信息。
•方法信息
•除了常量之外的全部類(靜態)變量。
•一個到類ClassLoader的引用。
•一個到Class類的引用。
常量池 虛擬機必須爲每一個被裝載的類型維護一個常量池。常量池就是該類型所用常量的一個有序集合,包括直接常量(string、integer和floating point常量)和對其餘類型、字段和方法的符號引用。池中的數據項就像數組同樣是經過索引訪問的。由於常量池存儲了相應類型所用到的全部類型、字段和方法的符號引用,因此它在Java程序的動態鏈接中起着核心的做用。
字段信息 對於類型中聲明的每個字段,方法區中必須保存下面的信息。除此以外,這些字段在類或接口中的聲明順序也必須保存。下面是字段信息的清單:
•字段名。
•字段的類型。
•字段的修飾符(public、private、protected.、static、final、volatile、transient的某個子集)。
方法信息 對於類型中聲明的每個方法,方法區中必須保存下面的信息。和字段同樣,這些方法在類或者接口中的聲明順序也必須保存。下面是力法信息的清單:
•方法名。
•方法的返回類型(或void)
•方法參數的數量和類型(按聲明順序).
•方法的修飾符(public、private、protected、static, find、synchronized、native、abstract的某個子集)。
除上面的清單中列出的條目以外,若是某個方法不是抽象的和本地的,它還必須保存下列信息:
•方法的字節碼(bytecodes)。
•操做數棧和該方法的棧幀中的局部變量區的大小。
•異常表。
類(靜態)變量類變量是由全部類實例共享的,可是即便沒有任何類實例,它也能夠被訪問。這些變量只與類有關——而非類的實例,所以它們老是做爲類型信息的一部分而存儲在方法區。除了在類中聲明的編譯時常量外,虛擬機在使用某個類以前,必須在方法區中爲這些類變量分配空間。
而編譯時常量(就是那些用final聲明以及用編譯時已知的值初始化的類變量)則和通常的類變量的處理方式不一樣,每一個使用編譯時常量的類型都會複製它的全部常量到本身的常量池中,或嵌人到它的字節碼流中。做爲常量池或字節碼流的一部分,編譯時常量保存在方法區中——就和通常的類變量同樣。可是當通常的類變量做爲聲明它們的類型的一部分數據面保存的時候,編譯時常量做爲使用它們的類型的一部分而保存。
指向ClassLoader類的引用 每一個類型被裝載的時候,虛擬機必須跟蹤它是由啓動類裝載器仍是由用戶自定義類裝載器裝載的。若是是用戶自定義類裝載器裝載的,那麼虛擬機必須在類型信息中存儲對該裝載器的引用。這是做爲方法表中的類型數據的一部分保存的。
虛擬機會在動態鏈接期間使用這個信息。當某個類型引用另外一個類型的時候,虛擬機會請求裝載發起引用類型的類裝載器來裝載被引用的類型。這個動態鏈接的過程,對於虛擬機分離命名空間的方式也是相當重要的。爲了可以正確地執行動態鏈接以及維護多個命名空間,虛擬機須要在方法表中得知每一個類都是由哪一個類裝載器裝載的。
指向Class類的引用 對於每個被裝載的類型(無論是類仍是接口)虛擬機都會相應地爲它建立一個java.lang.Class類的實例,並且虛擬機還必須以某種方式把這個實例和存儲在方法區中的類型數據關聯起來。在你的Java程序中,你能夠獲得並使用指向Class對象的引用。Class類中的一個靜態方法可讓用戶獲得任何己裝載的類的Class實例的引用。
public static Class forName(String classHame) //鏈接數據庫經常使用此方法
好比,若是調用forName("java.lang.Object"),那麼將獲得一個表明java.lang.Object的Class對象的引用。若是調用forName("java.util.Enumeration"),那麼獲得的是表明java.util包中java.util.Enumeration接口的Class對象的引。可使用forName()來獲得表明任何包中任何類型的Class對象的引用,只要這個類型能夠被(或者已經被)裝載到當前命名空間中。若是虛擬機沒法把請求的類型裝載到當前命名空間,那麼forName ()會拋出ClassNotFoundException異常。
另外一個獲得Class對象引用的方法是,能夠調用任何對象引用的getClass()方法。這個方法被來自Object類自己的全部對象繼承:
Public final class getClass();
好比,若是你有一個到java.lang.Integer類的對象的引用,那麼你只需簡單地調用Integer對象引用的getClass()方法,就能夠獲得表不java.lang,Integer類的Class對象。給出一個指向Class對象的引用,就能夠經過Class類中定義的方法來找出這個類型的相關信息。若是查看這些方法,會很快意識到,Class類使得運行程序能夠訪問方法區中保存的信息。
下面是Class類中生明的方法:
public String getNameO;
public Class getSuperClass();
public boolean islnterface();
public Class[] getlnterface();
public ClassLoader getClassLoader ();
這些方法僅能返回已裝載類型的信息。getName()返回類型的全限定名,getSuperChss()返回類型的直接超類的Class實例。若是類型是java.lang.Object類或者是一個接口,它們都沒有超類,getSuperClass()返回null。Islntcrface()判斷該類型是不是接口,若是Class對象描述一個接口就返回true;若是它描述一個類則返回false。getlnterfaces()返回一個Class對象數組,其中每一個Class對象對應一個直接超接口,超接口在數組中以類型聲明超接口的順序出現。若是該類型沒有直接超接口,getlnterfaces()則返回一個長度爲零的數紐。getClassLoader()返回裝載該類型的ClassLoadeT對象的引用,若是類型是由啓動類裝載器裝載的,則返回null。全部這些信息都直接從方法區中得到。
方法表 爲了儘量提升訪問效率,設計者必須仔細設計存儲在方法區中的類型信息的數據結構,所以,除了以上討論的原始類型信息,實現中還可能包括其餘數據結構以加快訪問原始數據的速度,好比方法表。虛擬機對每一個裝載的非抽象類,都生成一個方法表,把它做爲類信息的一部分保存在方法表中。方法表是一個數組,它的元素是全部它的實例可能被調用的實例方法的直接引用,包括那些從超類繼承過來的實例方法。(對於抽象類和接口,方法表沒有什麼幫助,由於程序決不會生成它們的實例。)運行時能夠經過方法錶快速搜尋在對象中調用的實例方法。
方法區使用示例,爲了展現虛擬機如何便用方法表中的信息,咱們舉個例子,看下面這個類:
Class Lava {
Private int speed = 5;
Void flow() {
}
}
Class Volcano{
Lava lava = new Lava();
lava.flow();
}
下面的段落描述了某個實現中是如何執行Volcano程序中main()方法的字節碼中第一條指令的。不一樣的虛擬機實現可能會用徹底不一樣的方法來操做,下面描述的只是其中一種可能——但並非僅有的一種,下面看一下Java虛擬機是如何執行Volcano程序中main ()方法的第一條指令的。
要運行Vokano程序,首先得以某種「依賴於實現的」方式告訴虛擬機「Volcano」這個名字。以後,虛擬機將找到並讀人相應的class文件「Volcano.class」,而後它會從導人的class文件裏的二進制數據中提取類型信息並放到方法區中。經過執行保存在方法區中的字節碼,虛擬機開始執行main()方法,在執行時,它會一直持有指向當前類(Volcano類)的常量池(方法區中的一個數據結構)的指針。
注意,虛擬機開始執Volcano類中main()方法的字節碼的時候,儘管Lava類還沒被裝載,可是和大多數(.也許全部)虛擬機實現同樣,它不會等到把程序中用到的全部類都裝載後纔開始運行程序。剛好相反,它在須要時才裝載相應的類。main()的第一條指令告知虛擬機爲列在常量池第一項的類分配足夠的內存。因此虛擬機使用指向Volcano常量池的指針找到第一項,發現它是一個對Lava類的符號引用,而後它就檢查方法區,看Lava類是否已經被裝載了。
這個符導引用僅僅是一個給出類Lava的全限定名「Lava」的字符串。爲了能讓虛擬機儘量快地從一個名稱找到類,設計者應當選擇最佳的數據結構和算法。這裏能夠採用各類方法,如散列表,搜索樹等等。一樣的算法也能夠用於實現Class類的forName()方法,這個方法根據給定的全限定名返同Class引用。
當虛擬機發現尚未裝載過名爲「Lava」的類時,它就開始査找並裝載文件「Lava.class」,並把從讀人的二逬制數據中提取的類型信息放在方法區中。緊接着,虛擬機以一個直接指向方法區Lava類數據的指針來替換常量池第一項(就是那個字符串「Lava」)——之後就能夠用這個指針來快速地訪問Lava類。這個替換過揮稱爲常量池解析,即把常量池中的符號引用替換爲直接引用。這是逋過在方法區中搜索被引用的元素實現的,在這期間可能又須要裝載其餘類。在這裏,咱們替換掉符號引用的「直接引用」是一個本地指針。
終於,虛擬機準備爲一個新的Lava對象分配內存。此吋,它又須要方法區中的信息。還記得剛剛放到Volcano類常量池第一項的指針嗎?如今虛擬機用它來訪問Lava類型倍息(此前剛放到方法區中的),找出其中記錄的這樣一個信息:一個Lava對象須要分配多少堆空間。
Java虛擬機總可以經過存儲於方法區的類型信息來肯定一個對象須要多少內存,可是,某個特定對象事實上須要多少內存,是跟特定實現相關的。對象在虛擬機內部的表示是由實現的設計者來決定的。
當Java虛擬機肯定了一個Lava對象的大小後,它就在堆上分配這麼大的空間,並把這個對象實例的變量speed切始化爲默認初始值0。假如Lava類的超類Object也有實例變量,則也會在此時被初始化力相應的默認值。
當把新生成的Lava對象的引用壓到棧中,main()方法的第—條指令也完成了。接下來的指令經過這個引用調用Java代碼(該代碼把speed變量初始化爲正確初始值5)。另一條指令將用這個引用調用Lava對象引用的flow()方法。
Java程序在運行時建立的全部類實例或數組都放在同一個堆中。而一個Java虛擬機實例中只存在一個堆空間,所以全部線程都將共享這個堆。又因爲一個Java程序獨佔一個Java虛擬機實例,於是每一個Java程序都有它本身的堆空間——它們不會彼此干擾。可是同一個Java程序的多個線程卻共享着同一個堆空間,在這種狀況下,就得考慮多線程訪問對象(堆數據)的同步問題了。
Java虛擬機有一條在堆中分配新對象的指令,卻沒存釋放內存的指令。正如你沒法用Java代碼去明確釋放一個對象同樣,字節碼指令也沒有對應的功能。虛擬機本身負責決定如何以及什麼時候釋放再也不被運行的程序引用的對象所佔據的內存。程序自己不用去考慮什麼時候需回收對象所佔用的內存,一般,虛擬機把這個任務交給垃圾收集器。
垃圾收集 垃圾收集器的主要工做就是自動回收再也不被運行的程序引用的對象所佔用的內存。此外,它也可能去移動那些還在使用的對象,以此減小堆碎片。
Java虛擬機規範並無強制規定垃圾收集器,它只要求虛擬機實現必須「以某種方式」管理本身的堆空間。舉個例子,某個實現可能只有固定大小的堆空問可用,當空間填滿,它就簡單地拋出OutOfMemory異常,根本不去考慮回收垃圾對象的問題。這樣的一個實現雖然簡陋,擔倒是符合規範的。總之,Java虛擬機規範並無規定具體的實現必須爲Java程序準備多少內存,也沒有說它必須怎麼管理自已的堆空間,它僅僅告訴實現的投計者:Java稈序須要從堆中爲對象分配空間,而且程序自己不會主動釋放它。所以堆空間的管理(包括垃圾收集)問題得由設計者自行去考慮處理方式。
Java虛擬機規範沒有指定垃圾收集應該採用什麼技術。這些都由虛擬機的設計者根據他們的目標、考慮所受的限制、用本身的能力去決定什麼纔是最好的技術。由於到對象的引用可能不少地方都存在,如Java棧、堆、方法區、本地方法棧,因此垃圾收集技術的使用在很大程度上會影響到運行時數據區的設計。
和方法區同樣,堆空間也沒必要是連續的內存區。在程序運行時,它能夠動態擴展或收縮。事實上,一個實現的方法區能夠在堆頂實現。換句話說,就是虛擬機須要爲一個新裝載的類分配內存時,類型信息和實際對象能夠都在同一個堆上。所以,負責回收無用對象的垃圾收集器可能也要負責無用類的釋放(卸載)。另外,某些實現可能也容許用戶或程序員指定堆的初始大小、最大最小值等等。
對象的內部表示 Java虛擬機規範並無規定lava對象在堆中是如何表示的。對象的內部表示也影響着整個堆以及垃圾收集器的設計,它由虛擬機的實現者決定。
Java對象中包含的基本數據由它所屬的類及其全部超類聲明的實例變量組成。只要有一個對象引用,虛擬機就必須可以快速地定位對象實例的數據。另外,它也必須能經過該對象引用訪問相應的類數據(存儲於方法區的類型信息)。所以在對象中一般會有一個指向方法區的指針。一種可能的堆空間設計就是,把堆分爲兩部分:一個句棲池,一個對象池,如圖5-5所示。而一個對象引用就是一個指向句棲池的本地指針。句柄池的每一個條目有兩部分:一個指向對象實例變量的指針,一個指向方法區類型數據的指針。這種設計的好處是有利於堆碎片的整理,當移動對象池中的對象時,句柄部分只需耍更改一下指針指向對象的新地址就能夠了——就是在句柄池中的那個指針。缺點是每次訪問對象的實例變量都要舒過兩次指針傳遞。
另外一種設計方式是使對象指針宜接指向一組數據,而讀數據包括對象實例數據以及指向方法區中類數據的指針。這樣設計的優缺點正好與前面的方法相反,它只須要一個指針就能夠訪問對象的實例數據,可是移動對象就變得更加複雜。當使用這種堆的虛擬機爲了減小內存碎片。而移動對象的時候,它必須在整個運行時數據K中更新指向被移動對象的引用。圖5-6描繪了這種表示對象的方法。
有以下幾個理由要求虛擬機必須可以經過對象引用獲得類(類權)數據:當程序在運行時須要轉換某個對象引用爲另外一種類型時,虛擬機必需要檢查這種轉換是否被容許,被轉換的對象是否的確足被引用的對象或者它的超類型。當程序在執行instanceof操做時,虛擬機也進行了一樣的檢查。在這兩種狀況下,虛擬機部須要查看被引用的對象的類數據。最後,當程序中調用某個實例方法時,虛擬機必須迸行動態綁定,換句話說,它不能按照引用的類型來決走將要調用的方法.而必須報據對象的'實際類。爲此,虛戒機必須再次經過對象的引用去訪問類數據。
無論虛擬機的實現使用什麼樣的對象表示法,極可能每一個對象都有一個方法表,由於方法表加快了調用實例方法時的效率,從而對Java虛擬機實現的總體性能起着很是重要的正面做用;可是Java虛擬機規範並未要求必須使用方法表,因此並是全部實現中都會使用它。好比那些有嚴格內存資源限制的實現,或許它們裉本不可能有足夠的額外內存資源來存儲方法展。若是一個實現使用方法表,那麼僅僅使用一個指向對象的引用,就能夠很快地訪問到對象的方法表。
下圖展現了一種把方法表和對象引用聯繫起來的實現方式。每一個對象的數據都包含一個指向特殊數據結構的指針,這個數據結構位於方法區,它包括兩部分:
•一個指向方法區對應類數據的指針。
•此對象的力法表。
方法表是個指針數組,其中的每一項都是一個指向「實例方法數據」的指針,實例方法能夠被那類的對象調用。方法表指向的實例方法數據包括如下信息:
•此方法的操做數棧和局部變裏區的大小。
•此方法的字節碼。
•異常表。
這些足夠虛擬機去用一個方法了,方法表中包含有方法指針---指向類或其超類聲明的方法的數據:也就是說,方法表所指向的方法多是此類聲明的,也多是它繼承下來的。
堆上的對象數據中還有一個邏輯部分,那就是對象鎖。這是—個互斥對象,虛擬機屮的每一個對象都有一個對象鎖,它被用於協調多個線程訪問同一個對象時的同步。在任什麼時候刻,只能有一個線程「擁有」這個對象鎖,所以只有這個線程才能訪問該對象的數據。此時其餘但願訪問這個對象的線程只能等待,直到擁有對象鎖的線程釋放鎖。當某個線程擁有一個對象鎖後,能夠繼續對這個鎖追加請求。但請求幾回,必須對應地釋放幾回,以後才能輪到其餘線程。好比一個線程清求了三次鎖,在它釋放三次鎖以前,它一直保持「擁有」這個鎖。
不少對象在其整個生命週期內都沒有被任何線程加鎖。在線程實際請求某個對象的鎖以前,實現對象鎖所須要的數據是沒必要要的。不少實現不在對象自身內部保存一個指向鎖數據的指針。而只有當第一次須要加鎖的時候才分配對應的鎖數據,但這時虛擬機要用某種間接方法來聯繫對象數據和對應的鎖數據,例如把鎖數據放在一個以對象地址爲索引的搜索樹中。
除了實現鎖所須要的數據外,每一個Java對象邏輯上還與實現等待集合(wait set)的數據相關聯。鎖是用來實現多個線程對共享數據的互斥訪問的,而等待集合是用來讓多個線程爲完成一個共同目標而協調工做的。
等待集合由等待方法和通知方法聯合使用。每一個類都從Object那裏繼承了三個等待方法(三個名爲wait()的重載方法)和兩個通知方法(notify()及notifyAll())。當某個線程在一個對象上調用等待方法吋,虛擬機就阻塞這個線程,並把它放在了這個對象的等待集合中。直到另外一個線程在同一個對象上調用通知方法,虛擬機會在以後的某個時刻喚醒一個或多個在等待集合中被阻塞的線程。正像鎖數據一樣,在實際調用對象的等待方法或通知方法以前,實現對象的等待集合的數椐並非必需的。所以,許多虛擬機實現都把等待集合數據與實際對象數據分開,只有在須要時才爲此對象建立同步數據(一般是在第一次調用等待方法或通知方法時)。
最後一種數據類型——能夠做爲堆中某個對象映像的一部分,是與拉圾收集器有關的數據。垃圾收集器必須(以某種方式)跟蹤程序引用的每一個對象,這個任務不可避免地要附加一些數據給這些對象,數據的類型要視拉圾收集使用的算法而定。例如,假如垃圾收集器使用「標記並清除」算法,這就須要可以標記對象可否被引用。此外,對於再也不被引用的對象,還須要指明它的終結方法(finalize)是否已經運行過了。像線程鎖同樣,這些數據也能夠放在對象數據外。有一些垃圾收集技術只在垃圾收集器運行時須要額外數據。例如「標記並清除」算法就使用一個獨立的位圖來標記對象的引用狀況。
除了標記對象的引用狀況外,垃圾收集器還要區分對象是否調用了終結方法。對幹在其類中聲明瞭終結方法的對象,在回收它以前,垃圾收集器必須調用它的終結方法。Java語言規範指出,拉圾收集器對每一個對象只能調用一次終結方法,可是容許終結方法復活(resurrect)這個對象,即容許該對象被再次引用。這樣當這個對象再次被回收時,就不用再調用終結方法了。須要終結方法的對象很少,而須要復活的更少,因此對一個對象回收兩次的情況不多見。這種用來標誌終結方法的數據雖然邏輯上是對象的一部分,但一般實現上不隨對象保存在堆中。大部分狀況下,垃圾收集器會在一個單獨的空間保存這個信息。
數組的內部表示 在Java中,數組是真正的對象。和其餘對象同樣,數組老是存儲在堆中。一樣,和普通對象同樣,實現的設計者將決定數組在堆中的表示形式。
和其餘全部對象同樣,數組也擁有一個與它們的類相關聯的Class實例,全部具備相同維度和類型的數組都是同一個類的實例,而無論數組的長度(多維數組每一維的長度)是多少,例如一個包含3個int整數的數組和一個包含300個int整數的數組擁有同一個類。數組的長度只與實例數據有關。
數組類的名稱由兩部分組成:每一維用一個方括號「[」表示,用字符或字符串表示類型。好比,元素類型爲int整數的、一維數組的類名爲「[I」,元素類型爲byte的三維數組爲「[[[B」,元素類型爲Object的二維數組「[[Ljava/lang/Object」。
多維數組被表示爲數組的數組。好比,int類型的二維數組,將表示爲一個一維數組,其中的毎個元素是一個一維int數組的引用。
在堆中的每一個數組對象還必須保存的數據是數組的長度、數組數據,以及某些指向數組的類數據的引用。虛擬機必須可以經過一個數組對象的引用獲得此數組的長度,經過索引訪問其元素(其間要檢查數組邊界是否越界),調用全部數組的直接超類Object聲明的方法等等。
對於一個運行中的Java程序而言,其中的每個線程都有它本身的PC(程序計數器)寄存器,它是在該線程啓動時建立的。PC寄存器的大小是一個字長,所以它既可以持有一個本地指針,也可以持有一個returnAddress。當線程執行某個Java方法時,PC寄存器的內容老是下一條將被執行指令的「地址」,這裏的「地址」能夠是一個本地指針,也能夠是在方法字節碼中相對於該方法起始指令的偏移量。若是該線程正在執行一個本地方法,那麼此PC寄存器的值是「undefined'」。
每當啓動一個新線程時,Java虛擬機都會爲它分配一個Java棧。前面咱們曾經提到,Java棧以幀爲單位保存線程的運行狀態。虛擬機只會直接對Java棧執行兩種操做:以幀爲單位的壓棧或出棧。某個線程正在執行的方法被稱爲該線程的當前方法,當前方法使用的幀棧稱爲當前幀,當前方法所屬的類稱爲當前類,當前類的常量池稱爲當前常量池。在線程執行一個方法時,它會跟蹤當前類和當前常量池。此外,當虛擬機遇到棧內操做指令時,它對當前幀內數據執行操做。
每當線程調用一個Java方法時,虛擬機都會在該線程的Java棧中壓人一個新幀。而這個新幀天然就成爲了當前偵。在執行這個方法時,它使用這個幀來存儲參數、局部變量、中間運算結果等等數據。
Java方法能夠以兩種方式完成。一種經過return返回的,稱爲正常返回;一種是經過拋出異常而異常停止的。無論以哪一種方式返回,虛擬機都會將當前幀彈出Java棧而後釋放掉,這樣上—個方法的幀就成爲當前幀了。
Java棧上的全部數據都是此線程私有的。任何線程都不能訪問另外一個線程的棧數據,所以咱們不須要考慮多線程狀況下棧數據的訪問同步問題。當一個線程調用一個方法時,方法的局部變量保存在調用線程Java找的幀中。只有一個線程能老是訪問那些局部變最,即調用方法的線程。
像方法區和堆同樣,Java棧和幀在內存中也沒必要是連續的。幀能夠分佈在連續的棧裏,也能夠分佈在堆裏,或者兩者兼而有之。表示Java棧和棧幀的實際數據結構由虛擬機的實現者決定,某些實現容許用戶指定Java棧的初始大小和最大最小值。
棧幀由三部分組成:局部變量區、操做數棧和幀數據區。局部變量區和操做數棧的大小要視對應的方法而定,它們是按字長計算的。編譯器在編譯時就肯定了這些值並放在class文件中。而幀數據區的大小依賴於具體的實現。
當虛擬機調用一個Java方法時,它從對應類的類型信息中獲得此方法的局部變量區和操做數棧的大小,並據此分配棧幀內存,而後壓入Java棧中。
局部變量區 Java棧幀的局部變量區被組織爲一個以字長爲單位、從0開始計數的數組。字節碼指令經過從0開始的索引來使用其中的數據類型。類型爲int、float、reference和returnAddress的值在數組中只佔據一項,而類型爲byte、short和char的值在存入數組前都將被轉換爲int值,於是一樣佔據一項。可是類型爲long和double的值在數組中卻佔據連續的兩項。
在訪問局部變量中的long和double值的時候,指令只需指出連續兩項中第一項的索引值。例如某個long值佔據第3、4項,那麼指令會取索引爲3的long值。局部變量區的全部值都是字對齊的,long和double這樣佔據兩項數組元素的值一樣能夠起始於任何索引。
局部變量區包含對應方法的參數和局部變量。編譯器首先按聲明的順序把這些參數放入局部變量數組。
除了Java方法的參數(編譯器首先嚴格按照它們的聲明順序放到局部變量數組中,而對於真正的局部變量,它能夠任意決定放置順序,甚至能夠用一個索引指代兩個局部變量---好比當兩個局部變量的做出域不重疊時,像下面Example3b中的局部變量i和j就是這種情形:在方法的前半段,在開始生效以前,0號索引的入口能夠被用來表明i。在方法的後半段,i經超過了有效做用域,0號入口就能夠用來表示j了。
class Example3b{
public static void runtwoLoops(){
for(int i=0; i < 10; ++i){
System.out.println(i);
}
for(int j=9; j >=0; --j){
System.out.println(j);
}
}
}
和其餘運行時內存區同樣,虛擬機的實現者能夠爲局部變量區設計任意的數據結構。好比對於怎樣把long和double類型的值存儲到兩個數組項中,Java虛擬機規範沒有指定。假如某個虛擬機實現的字長爲64位,這時就能夠把整個long或double數據放在數組中相鄰兩數組項的低項內,而使高項保持爲空。
操做數棧 和局部變量區同樣,操做數棧也是被組織成一個以字長爲單位的數組。可是和前者不一樣的是,它不是經過索引來訪問,而是經過標準的棧操做——壓棧和出棧——來訪問的。好比,若是某個指令把一個值壓人到操做數棧中,稍後另外一個指令就能夠彈出這個值來使用。
虛擬機在操做數棧中存儲數據的方式和在局部變量區中是同樣的,如int、long、float、double、reference和returnType的存儲。對於byte、short以及char類型的值在壓入到操做數棧以前,也會被轉換爲int。
不一樣於程序計數器,Java虛擬機沒有寄存器,程序計數器也沒法被程序指令直接訪問。Java虛擬機的指令是從操做數棧中而不是從寄存器中取得操做數的,所以它的運行方式是基於棧的而不是基於寄存器的。雖然指令也能夠從其餘地方取得操做數,好比從字節流中跟隨在操做碼(表明指令的字節)以後的字節中或從常量池中,可是主要仍是從操做數棧中得到操做數。
虛擬機把操做數棧做爲它的工做區——大多數指令都要從這裏彈出數據,執行運算,而後把結果壓回操做數棧。好比,iadd指令就要從操做數棧中彈出兩個整數,執行加法運算,其結果又壓回到操做數棧中。看看下面的示例,它演示了虛擬機是如何把兩個int類型的局部變量相加,再把結果保存到第三個局部變量的:
iload_0 //push the int in local variable 0
iload_l // push the int in local variable 1
iadd // pop two ints, add them, push result
istore_2 /7 pop int, store into local variable 2
在這個字節碼序列裏,前兩個指令iload_0和iload_l將存儲在局部變量區中索引爲0和1的整數壓人操做數棧中,其後iadd指令從操做數棧中彈出那兩個整數相加,再將結果壓入操做數棧。第四條指令istore_2則從操做數棧中彈出結果,並把它存儲到局部變量區索引爲2的位置。圖5-10詳細表述了這個過程當中局部變量和操做數棧的狀態變化,閣中沒有使用的局部變量區和操做數棧區域以空白表示。
幀數據區 除了局部變量區和操做數棧外,Java棧幀還須要一些數據來支持常量池解析、正常方法返回以及異常派發機制,這些信息都保存在Java棧幀的幀數據區中。
Java虛擬機中的大多數指令都涉及到常量池入口。有些指令僅僅是從常量池中取出數據而後壓人Java棧(這些數據的類型包括int、long、float、double和String);還有些指令使用常暈池的數據來指示要實例化的類或數組、要訪問的字段,或要調用的方法;還有些指令須要常量池中的數據才能肯定某個對象是否屬於某個類或實現了某個接口。
每一個虛擬機要執行某個須要到常量池數據的指令時,它都會經過幀數掘區中指向常量池的指針來訪問它。之前講過,常景池中對類型、字段和方法的引用在開始時都是符號。當虛擬機在常量池中搜索的時候,若是遇到指向類、接口、字段或者方法的入口,倘若它們仍然是符號,虛擬機那時候纔會(也必須)進行解析。
除了用於常量池的解析外,幀數據區還要幫助虛擬機處埋Java方法的正常結束或異常停止。若是是經過return正常結束,虛擬機必須恢復發起調用的方法的棧幀,包括設置PC寄存器指向發起調用的方法中的指令---即緊跟着調用了完成方法的指令的下一個指令。假如方法有返回值,虛擬機必須將它壓入到發起調用的方法的操做數棧,爲了處理Java方法執行期間的異常退出狀況,幀數據區還必須保存一個對此方法異常表的引用。異常表會在第17章深刻描述,它定義了在這個方法的字節碼中受catch子句保護的範圍,異常表中的每一項都有一個被catch子句保護的代碼的起始和結束位置(譯者注:即try子句內部的代碼),可能被catch的異常類在常量池中的索引值,以及catch子句內的代開始的位置。
當某個方法拋出異常時,虛擬機根據幀數據區對應的異常表來決定如何處理。若是在異常表中找到了匹配的catch子句,就會把控制權轉交給catch子句內的代碼。若是沒有發現,方法會當即異常終止。而後虛擬機使用幀數據區的信息恢復發起調用的方法的幀,而後在發起調用的方法的上下文中從新拋出一樣的異常。
除了上述信息(支持常量池解析、正常方法返回和異常派發的數據)外,虛擬機的實現者也能夠將其餘信息放人幀數據區,如用於調試的數據等。
前面提到的全部運行時數據區都是在Java虛擬機規範中明肯定義的,除此以外,對於一個運行中的Java程序而言,它還可能會用到一些跟本地方法相關的數據區。當某個線程調用一個本地方法時,它就進入了一個全新的而且再也不受虛擬機限制的世界。本地方法能夠經過本地方法接口來訪問虛擬機的運行時數據區,但不止於此,它還能夠作任何它想作的事情。好比,它甚至能夠直接使用本地處理器中的寄存器,或者直接從本地內存的堆中分配任意數量的內存等等。總之,它和虛擬機擁有一樣的權限(或者說能力)。
本地方法本質上是依賴於實現的,虛擬機實現的設計者們能夠自由地決定使用怎樣的機制來讓Java程序調用本地方法。
任何本地方法接口都會使用某種本地方法棧。當線程調用Java方法時,虛擬機會建立一個新的棧幀並壓人Java棧。然而當它調用的是本地方法時,虛擬機會保持Java棧不變,再也不在線程的Java棧中壓人新的幀,虛擬機只是簡單地動態鏈接並直接調用指定的本地方法。能夠把這看作是虛擬機利用本地方法來動態擴展本身。就如同lava虛擬機的實如今按照其中運行的Java程序的吩附,調用屬於虛擬機內部的另外一個(動態鏈接的)方法。
若是某個虛擬機實現的本地方法接口是使用C鏈接模型的話,那麼它的本地方法棧就是C棧。咱們知道,當C程序調用一個C函數時,其棧操做都是肯定的。傳遞給該函數的參數以某個肯定的順序壓入棧,它的返回值也以肯定的方式傳回調用者。一樣,這就是該虛擬機實現中本地方法棧的行爲。
極可能本地方法接口須要回調Java虛擬機中的Java方法(這也是由設計者決定的),在這種情形下,該線程會保存本地方法棧的狀態並進人到另外一個Java棧。
圖5-13描繪了這種狀況,就是當一個線程調用一個本地方法時,本地方法又回調虛擬機中的另外一個Java方法。這幅圖展現了Java虛擬機內部線程運行的全景圖。一個線程可能在整個生命週期中都執行Java方法,操做它的Java棧;或者它可能毫無障礙地在Java棧和本地方法棧之間跳轉。
如圖5-13所示,該線程首先調用了兩個Java方法,而第二個Java方法又調用了一個本地方法,這樣致使虛擬機使用了一個本地方法棧。圖中的本地方法棧顯示爲一個連續的內存空間。假設這是一個C語言棧,其間有兩個C函數,它們都以包圍在虛線中的灰色塊表示。第一個C函數被第二個Java方法當作本地方法調用,而這個C函數又調用了第二個C函數。以後第二個C函數又經過本地方法接口回調了一個Java方法(第三個Java方法),最終這個Java方法又調用了一個Java方法(它成爲圖中的當前方法)。
就像其餘運行時內存區同樣,本地方法棧佔用的內存區也沒必要是固定大小的,它能夠根據須要動態擴展或者收縮。某些實現也容許用戶或者程序員指定該內存區的初始大小以及最大、最小值。