Java編寫的代碼會按照下圖的流程來執行java
類裝載器裝載負責裝載編譯後的字節碼,並加載到運行時數據區(Runtime Data Area),而後執行引擎執行會執行這些字節碼。web
Java提供了動態的裝載特性;它會在運行時的第一次引用到一個class的時候對它進行裝載和連接,而不是在編譯期進行。JVM的類裝載器負責動態裝載。Java類裝載器有以下幾個特色:編程
每一個類裝載器都有一個本身的命名空間用來保存已裝載的類。當一個類裝載器裝載一個類時,它會經過保存在命名空間裏的類全侷限定名(Fully Qualified Class Name)進行搜索來檢測這個類是否已經被加載了。若是兩個類的全侷限定名是同樣的,可是若是命名空間不同的話,那麼它們仍是不一樣的類。不一樣的命名空間表示class被不一樣的類裝載器裝載。bootstrap
下圖展現了類裝載器的代理模型。數組
當一個類裝載器(class loader)被請求裝載類時,它首先按照順序在上層裝載器、父裝載器以及自身的裝載器的緩存裏檢查這個類是否已經存在。簡單來講,就是在緩存裏查看這個類是否已經被本身裝載過了,若是沒有的話,繼續查找父類的緩存,直到在bootstrap類裝載器裏也沒有找到的話,它就會本身在文件系統裏去查找而且加載這個類。緩存
相似於web應用服務(WAS)之類的框架會用這種結構來對Web應用和企業級應用進行分離。換句話來講,類裝載器的代理模型能夠用來保證不一樣應用之間的相互獨立。WAS類裝載器使用這種層級結構,不一樣的WAS供應商的裝載器結構有稍許區別。安全
若是類裝載器查找到一個沒有裝載的類,它會按照下圖的流程來裝載和連接這個類:性能優化
每一個階段的描述以下:架構
JVM規範定義了上面的幾個任務,不過它容許具體執行的時候可以有些靈活的變更。框架
運行時數據區是在JVM運行的時候操做所分配的內存區。運行時內存區能夠劃分爲6個區域。在這6個區域中,一個PC Register,JVM stack 以及Native Method Statck都是按照線程建立的,Heap,Method Area以及Runtime Constant Pool都是被全部線程公用的。
如今咱們再會過頭來看看以前反彙編的字節碼
public
void
add(java.lang.String);
Code:
0
: aload_0
1
: getfield #
15
;
//Field admin:Lcom/nhn/user/UserAdmin;
4
: aload_1
5
: invokevirtual #
23
;
//Method com/nhn/user/UserAdmin.addUser:(Ljava/lang/String;)Lcom/nhn/user/User;
8
: pop
9
:
return
把上面的反彙編代碼和咱們平時所見的x86架構的彙編代碼相比較,咱們會發現這二者的結構有點類似,都使用了操做碼;不過,有一點不一樣的地方是Java字節碼並不會在操做數裏寫入寄存器的名稱、內存地址或者偏移量。以前已經說過,JVM用的是棧,它不會使用寄存器。和使用寄存器的x86架構不一樣,它本身負責內存的管理。它用索引例如15和23來代替實際的內存地址。15和23都是當前類(這裏是UserService類)的常量池裏的索引。簡而言之,JVM爲每一個類建立了一個常量池,而且這個常量池裏保存了實際目標的引用。
每行反彙編代碼的解釋以下:
下圖能夠幫助你更好地理解上面的內容。
順便提一下,在這個方法裏,局部變量數組沒有被修改。因此上圖只顯示了操做數棧的變化。不過,大部分的狀況下,局部變量數組也是會改變的。局部變量數組和操做數棧之間的數據傳輸是使用經過大量的load指令(aload,iload)和store指令(astore,istore)來實現的。
在這個圖裏,咱們簡單驗證了運行時常量池和JVM棧的描述。當JVM運行的時候,每一個類的實例都會在堆上進行分配,User,UserAdmin,UserService以及String等類的信息都會保存在方法區。
經過類裝載器裝載的,被分配到JVM的運行時數據區的字節碼會被執行引擎執行。執行引擎以指令爲單位讀取Java字節碼。它就像一個CPU同樣,一條一條地執行機器指令。每一個字節碼指令都由一個1字節的操做碼和附加的操做數組成。執行引擎取得一個操做碼,而後根據操做數來執行任務,完成後就繼續執行下一條操做碼。
不過Java字節碼是用一種人類能夠讀懂的語言編寫的,而不是用機器能夠直接執行的語言。所以,執行引擎必須把字節碼轉換成能夠直接被JVM執行的語言。字節碼能夠經過如下兩種方式轉換成合適的語言。
不過,用JIT編譯器來編譯代碼所花的時間要比用解釋器去一條條解釋執行花的時間要多。所以,若是代碼只被執行一次的話,那麼最好仍是解釋執行而不是編譯後再執行。所以,內置了JIT編譯器的JVM都會檢查方法的執行頻率,若是一個方法的執行頻率超過一個特定的值的話,那麼這個方法就會被編譯成本地代碼。
JVM規範沒有定義執行引擎該如何去執行。所以,JVM的提供者經過使用不一樣的技術以及不一樣類型的JIT編譯器來提升執行引擎的效率。
大部分的JIT編譯器都是按照下圖的方式來執行的:
JIT編譯器把字節碼轉換成一箇中間層表達式,一種中間層的表示方式,來進行優化,而後再把這種表示轉換成本地代碼。
Oracle Hotspot VM使用一種叫作熱點編譯器的JIT編譯器。它之因此被稱做」熱點「是由於熱點編譯器經過分析找到最須要編譯的「熱點」代碼,而後把熱點代碼編譯成本地代碼。若是已經被編譯成本地代碼的字節碼再也不被頻繁調用了,換句話說,這個方法再也不是熱點了,那麼Hotspot VM會把編譯過的本地代碼從cache裏移除,而且從新按照解釋的方式來執行它。Hotspot VM分爲Server VM和Client VM兩種,這兩種VM使用不一樣的JIT編譯器。
Client VM 和Server VM使用徹底相同的運行時,不過如上圖所示,它們所使用的JIT編譯器是不一樣的。Server VM用的是更高級的動態優化編譯器,這個編譯器使用了更加複雜而且更多種類的性能優化技術。
IBM 在IBM JDK 6裏不只引入了JIT編譯器,它同時還引入了AOT(Ahead-Of-Time)編譯器。它使得多個JVM能夠經過共享緩存來共享編譯過的本地代碼。簡而言之,經過AOT編譯器編譯過的代碼能夠直接被其餘JVM使用。除此以外,IBM JVM經過使用AOT編譯器來提早把代碼編譯器成JXE(Java EXecutable)文件格式來提供一種更加快速的執行方式。
大部分Java程序的性能都是經過提高執行引擎的性能來達到的。正如JIT編譯器同樣,不少優化的技術都被引入進來使得JVM的性能一直可以獲得提高。最原始的JVM和最新的JVM最大的差異之處就是在於執行引擎。
Hotspot編譯器在1.3版本的時候就被引入到Oracle Hotspot VM裏了,JIT編譯技術在Anroid 2.2版本的時候被引入到Dalvik VM裏。
引入一種中間語言,例如字節碼,虛擬機執行字節碼,而且經過JIT編譯器來提高JVM的性能的這種技術以及普遍應用在使用中間語言的編程語言上。例如微軟的.Net,CLR(Common Language Runtime 公共語言運行時),也是一種VM,它執行一種被稱做CIL(Common Intermediate Language)的字節碼。CLR提供了AOT編譯器和JIT編譯器。所以,用C#或者VB.NET編寫的源代碼被編譯後,編譯器會生成CIL而且CIL會執行在有JIT編譯器的CLR上。CLR和JVM類似,它也有垃圾回收機制,而且也是基於堆棧運行。
2011年7月28日,Oracle發佈了Java SE的第7個版本,而且把JVM規也更新到了相應的版本。在1999年發佈《The Java Virtual Machine Specification,Second Edition》後,Oracle花了12年來發布這個更新的版本。這個更新的版本包含了這12年來累積的衆多變化以及修改,而且更加細緻地對規範進行了描述。此外,它還反映了《The Java Language Specificaion,Java SE 7 Edition》裏的內容。主要的變化總結以下:
最大的改變是添加了invokedynamic指令。也就是說JVM的內部指令集作了修改,使得JVM開始支持動態類型的語言,這種語言的類型不是固定的,例如腳本語言以及來自Java SE 7裏的Java語言。以前沒有被用到的操做碼186被分配給新指令invokedynamic,並且class文件格式裏也添加了新的內容來支持invokedynamic指令。
Java SE 7的編譯器生成的class文件的版本號是51.0。Java SE 6的是50.0。class文件的格式變更比較大,所以,51.0版本的class文件不可以在Java SE 6的虛擬機上執行。
儘管有了這麼多的變更,可是Java方法的65535字節的限制仍是沒有被去掉。除非class文件的格式完全改變,否者這個限制未來也是不可能去掉的。
值得說明的是,Oracle Java SE 7 VM支持G1這種新的垃圾回收機制,不過,它被限制在Oracle JVM上,所以,JVM自己對於垃圾回收的實現不作任何限制。也所以,在JVM規範裏沒有對它進行描述。
Java SE 7裏添加了不少新的語法和特性。不過,在Java SE 7的版本里,相對於語言自己而言,JVM沒有多少的改變。那麼,這些新的語言特性是怎麼來實現的呢?咱們經過反彙編的方式來看看switch語句裏的String(把字符串做爲switch()語句的比較對象)是怎麼實現的?
例如,下面的代碼:
// SwitchTest
public
class
SwitchTest {
public
int
doSwitch(String str) {
switch
(str) {
case
"abc"
:
return
1
;
case
"123"
:
return
2
;
default
:
return
0
;
}
}
}
C:Test>javap -c SwitchTest.classCompiled from
"SwitchTest.java"
public
class
SwitchTest {
public
SwitchTest();
Code:
0
: aload_0
1
: invokespecial #
1
// Method java/lang/Object."<init>":()V
4
:
return
public
int
doSwitch(java.lang.String);
Code:
0
: aload_1
1
: astore_2
2
: iconst_m1
3
: istore_3
4
: aload_2
5
: invokevirtual #
2
// Method java/lang/String.hashCode:()I
8
: lookupswitch {
// 2
48690
:
50
96354
:
36
default
:
61
}
36
: aload_2
37
: ldc #
3
// String abc
39
: invokevirtual #
4
// Method java/lang/String.equals:(Ljava/lang/Object;)Z
42
: ifeq
61
45
: iconst_0
46
: istore_3
47
:
goto
61
50
: aload_2
51
: ldc #
5
// String 123
53
: invokevirtual #
4
// Method java/lang/String.equals:(Ljava/lang/Object;)Z
56
: ifeq
61
59
: iconst_1
60
: istore_3
61
: iload_3
62
: lookupswitch {
// 2
0
:
88
1
:
90
default
:
92
}
88
: iconst_1
89
: ireturn
90
: iconst_2
91
: ireturn
92
: iconst_0
93
: ireturn
在#5和#8字節處,首先是調用了hashCode()方法,而後它做爲參數調用了switch(int)。在lookupswitch的指令裏,根據hashCode的結果進行不一樣的分支跳轉。字符串「abc"的hashCode是96354,它會跳轉到#36處。字符串」123「的hashCode是48690,它會跳轉到#50處。生成的字節碼的長度比Java源碼長多了。首先,你能夠看到字節碼裏用lookupswitch指令來實現switch()語句。不過,這裏使用了兩個lookupswitch指令,而不是一個。若是反編譯的是針對Int的switch()語句的話,字節碼裏只會使用一個lookupswitch指令。也就是說,針對string的switch語句被分紅用兩個語句來實現。留心標號爲#5,#39和#53的指令,來看看switch()語句是如何處理字符串的。
在第#36,#37,#39,以及#42字節的地方,你能夠看見str參數被equals()方法來和字符串「abc」進行比較。若是比較的結果是相等的話,‘0’會被放入到局部變量數組的索引爲#3的位置,而後跳抓轉到第#61字節。
在第#50,#51,#53,以及#56字節的地方,你能夠看見str參數被equals()方法來和字符串「123」進行比較。若是比較的結果是相等的話,10’會被放入到局部變量數組的索引爲#3的位置,而後跳轉到第#61字節。
在第#61和#62字節的地方,局部變量數組裏索引爲#3的值,這裏是'0',‘1’或者其餘的值,被lookupswitch用來進行搜索並進行相應的分支跳轉。
換句話來講,在Java代碼裏的用來做爲switch()的參數的字符串str變量是經過hashCode()和equals()方法來進行比較,而後根據比較的結果,來執行swtich()語句。
在這個結果裏,編譯後的字節碼和以前版本的JVM規範沒有不兼容的地方。Java SE 7的這個用字符串做爲switch參數的特性是經過Java編譯器來處理的,而不是經過JVM來支持的。經過這種方式還能夠把其餘的Java SE 7的新特性也經過Java編譯器來實現。
我不認爲爲了使用好Java必須去了解Java底層的實現。許多沒有深刻理解JVM的開發者也開發出了不少很是好的應用和類庫。不過,若是你更加理解JVM的話,你就會更加理解Java,這樣你會有助於你處理相似於咱們前面的案例中的問題。