本文首先介紹一下Java虛擬機的生存週期,而後大體介紹JVM的體系結構,最後對體系結構中的各個部分進行詳細介紹。( 首先這裏澄清兩個概念:JVM實例和JVM執行引擎實例,JVM實例對應了一個獨立運行的java程序,而JVM執行引擎實例則對應了屬於用戶運行程序的線程;也就是JVM實例是進程級別,而執行引擎是線程級別的。)java
1、 JVM的生命週期 JVM實例的誕生:當啓動一個Java程序時,一個JVM實例就產生了,任何一個擁有public static void main(String[] args)函數的class均可以做爲JVM實例運行的起點,既然如此,那麼JVM如何知道是運行class A的main而不是運行class B的main呢?這就須要顯式的告訴JVM類名,也就是咱們平時運行java程序命令的由來,如java classA hello world,這裏java是告訴os運行Sun java 2 SDK的java虛擬機,而classA則指出了運行JVM所須要的類名。 JVM實例的運行:main()做爲該程序初始線程的起點,任何其餘線程均由該線程啓動。JVM內部有兩種線程:守護線程和非守護線程,main()屬於非守護線程,守護線程一般由JVM本身使用,java程序也能夠標明本身建立的線程是守護線程。 JVM實例的消亡:當程序中的全部非守護線程都終止時,JVM才退出;若安全管理器容許,程序也可使用Runtime類或者System.exit()來退出。算法
2、JVM的體系結構 粗略分來,JVM的內部體系結構分爲三部分,分別是:類裝載器(ClassLoader)子系統,運行時數據區,和執行引擎。 下面將先介紹類裝載器,而後是執行引擎,最後是運行時數據區編程
1,類裝載器,顧名思義,就是用來裝載.class文件的。JVM的兩種類裝載器包括:啓動類裝載器和用戶自定義類裝載器,啓動類裝載器是JVM實現的一部分,用戶自定義類裝載器則是Java程序的一部分,必須是ClassLoader類的子類。(下面所述狀況是針對Sun JDK1.2)動類裝載器:只在系統類(java API的類文件)的安裝路徑查找要裝入的類 用戶自定義類裝載器: 系統類裝載器:在JVM啓動時建立,用來在CLASSPATH目錄下查找要裝入的類 其餘用戶自定義類裝載器:這裏有必要先說一下ClassLoader類的幾個方法,瞭解它們對於瞭解自定義類裝載器如何裝載.class文件相當重要。 protected final Class defineClass(String name, byte data[], int offset, int length) ;protected final Class defineClass(String name, byte data[], int offset, int length, ProtectionDomain protectionDomain); protected final Class findSystemClass(String name) ;protected final void resolveClass(Class c) defineClass用來將二進制class文件(新類型)導入到方法區,也就是這裏指的類是用戶自定義的類(也就是負責裝載類) findSystemClass經過類型的全限定名,先經過系統類裝載器或者啓動類裝載器來裝載,並返回Class對象。 ResolveClass: 讓類裝載器進行鏈接動做(包括驗證,分配內存初始化,將類型中的符號引用解析爲直接引用),這裏涉及到java命名空間的問題,JVM保證被一個類裝載器裝載的類所引用的全部類都被這個類裝載器裝載,同一個類裝載器裝載的類之間能夠相互訪問,可是不一樣類裝載器裝載的類看不見對方,從而實現了有效的屏蔽。數組
2, 執行引擎:它或者在執行字節碼,或者執行本地方法 要說執行引擎,就不得不的指令集,每一條指令包含一個單字節的操做碼,後面跟0個或者多個操做數。(一)指令集以棧爲設計中心,而非以寄存器爲中心 這種指令集設計如何知足Java體系的要求: 平臺無關性:以棧爲中心使得在只有不多register的機器上實現java更便利 compiler通常採用stack向鏈接優化器傳遞編譯的中間結果,若指令集以stack爲基礎,則有利於運行時進行的優化工做與執行即時編譯或者自適應優化的執行引擎結合,通俗的說就是使編譯和運行用的數據結構統一,更有利於優化的開展。網絡移動性:class文件的緊湊性。 安全性:指令集中絕大部分操做碼都指明瞭操做的類型。(在裝載的時候使用數據流分析期進行一次性驗證,而非在執行每條指令的時候進行驗證,有利於提升執行速度)。(二)執行技術 主要的執行技術有:解釋,即時編譯,自適應優化、芯片級直接執行 其中解釋屬於第一代JVM,即時編譯JIT屬於第二代JVM,自適應優化(目前Sun的HotspotJVM採用這種技術)則吸收第一代JVM和第二代JVM的經驗,採用二者結合的方式 自適應優化:開始對全部的代碼都採起解釋執行的方式,並監視代碼執行狀況,而後對那些常常調用的方法啓動一個後臺線程,將其編譯爲本地代碼,並進行仔細優化。若方法再也不頻繁使用,則取消編譯過的代碼,仍對其進行解釋執行。 3,運行時數據區:主要包括:方法區,堆,java棧,PC寄存器,本地方法棧 (1)方法區和堆由全部線程共享 堆:存放全部程序在運行時建立的對象 方法區:當JVM的類裝載器加載.class文件,並進行解析,把解析的類型信息放入方法區。 (2)Java棧和PC寄存器由線程獨享,在新線程建立時間裏 (3)本地方法棧: 存儲本地方法調用的狀態 上邊整體介紹了運行時數據區的主要內容,下邊進行詳細介紹,要介紹數據區,就不得不說明JVM中的數據類型。 JVM中的數據類型:JVM中基本的數據單元是word,而word的長度由JVM具體的實現者來決定 數據類型包括基本類型和引用類型, (1) 基本類型包括:數值類型(包括除boolean外的全部的java基本數據類型),boolean(在JVM中使用int來表示,0表示false,其餘int值均表示true)和returnAddress(JVM的內部類型,用來實現finally子句)。 (2)引用類型包括:數組類型,類類型,接口類型 前邊講述了JVM中數據的表示,下面讓咱們輸入到JVM的數據區 首先來看方法區: 上邊已經提到,方法區主要用來存儲JVM從class文件中提取的類型信息,那麼類型信息是如何存儲的呢?衆所周知,Java使用的是大端序(big—endian:即低字節的數據存儲在高位內存上,如對於1234,12是高位數據,34爲低位數據,則java中的存儲格式應該爲12存在內存的低地址,34存在內存的高地址,x86中的存儲格式與之相反)來存儲數據,這其實是在class文件中數據的存儲格式,可是當數據倒入到方法區中時,JVM能夠以任何方式來存儲它。類型信息:包括class的全限定名,class的直接父類,類類型仍是接口類型,類的修飾符(public,等),全部直接父接口的列表,Class對象提供了訪問這些信息的窗口(可經過Class.forName(「」)或instance.getClass()得到),下面是Class的方法,相信你們看了會恍然大悟,(原來如此J) getName(), getSuperClass(), isInterface(), getInterfaces(), getClassLoader(); static變量做爲類型信息的一部分保存 指向ClassLoader類的引用:在動態鏈接時裝載該類中引用的其餘類指向Class類的引用:必然的,上邊已述 該類型的常量池:包括直接常量(String,integer和float point常量)以及對其餘類型、字段和方法的符號引用(注意:這裏的常量池並非普通意義上的存儲常量的地方,這些符號引用多是咱們在編程中所接觸到的變量),因爲這些符號引用,使得常量池成爲java程序動態鏈接中相當重要的部分 字段信息:普通意義上的類型中聲明的字段 方法信息:類型中各個方法的信息 編譯期常量:指用final聲明或者用編譯時已知的值初始化的類變量 class將全部的常量複製至其常量池或者其字節碼流中。 方法表:一個數組,包括全部它的實例可能調用的實例方法的直接引用(包括從父類中繼承來的)除此以外,若某個類不是抽象和本地的,還要保存方法的字節碼,操做數棧和該方法的棧幀,異常表。 舉例: class Lava{ private int speed = 5; void flow(){} } class Volcano{ public static void main(String[] args){ Lava lava = new Lava(); lava.flow(); } } 運行命令java Volcano; (1) JVM找到Volcano.class倒入,並提取相應的類型信息到方法區。經過執行方法區中的字節碼,JVM執行main()方法,(執行時會一直保存指向Vocano類的常量池的指針) (2) Main()中第一條指令告訴JVM需爲列在常量池第一項的類分配內存(此處再次說明了常量池並不是只存儲常量信息),而後JVM找到常量池的第一項,發現是對Lava類的符號引用,則檢查方法區,看Lava類是否裝載,結果是還未裝載,則查找「Lava.class」,將類型信息寫入方法區,並將方法區Lava類信息的指針來替換Volcano原常量池中的符號引用,即用直接引用來替換符號引用。 (3) JVM看到new關鍵字,準備爲Lava分配內存,根據Volcano的常量池的第一項找到Lava在方法區的位置,並分析須要多少對空間,肯定後,在堆上分配空間,並將speed變量初始爲0,並將lava對象的引用壓到棧中(4) 調用lava的flow()方法 好了,大體瞭解了方法區的內容後,讓咱們來看看堆 java對象的堆實現: java對象主要由實例變量(包括本身所屬的類和其父類聲明的)以及指向方法區中類數據的指針,指向方法表的指針,對象鎖(非必需),等待集合(非必需),GC相關的數據(非必需)(主要視GC算法而定,如對於標記並清除算法,須要標記對象是否被引用,以及是否已調用finalize()方法)。 那麼爲何java對象中要有指向類數據的指針呢?咱們從幾個方面來考慮首先:當程序中將一個對象引用轉爲另外一個類型時,如何檢查轉換是否容許?需用到類數據 其次:動態綁定時,並非須要引用類型,而是須要運行時類型, 這裏的迷惑是:爲何類數據中保存的是實際類型,而非引用類型?這個問題先留下來,我想在後續的讀書筆記中應該能明白指向方法表的指針:這裏和C++的VTBL是相似的,有利於提升方法調用的效率對象鎖:用來實現多個線程對共享數據的互斥訪問 等待集合:用來讓多個線程爲完成共同目標而協調功過。(注意Object類中的wait(),notify(),notifyAll()方法)。 Java數組的堆實現:數組也擁有一個和他們的類相關聯的Class實例,具備相同dimension和type的數組是同一個類的實例。數組類名的表示:如[[Ljava/lang/Object 表示Object[][],[I表示int[],[[[B表示byte[][][] 至此,堆已大體介紹完畢,下面來介紹程序計數器和java棧 程序計數器:爲每一個線程獨有,在線程啓動時建立, 若thread執行java方法,則PC保存下一條執行指令的地址。 若thread執行native方法,則Pc的值爲undefined Java棧:java棧以幀爲單位保存線程的運行狀態,java棧只有兩種操做,幀的壓棧和出棧。每一個幀表明一個方法,java方法有兩種返回方式,return和拋出異常,兩種方式都會致使該方法對應的幀出棧和釋放內存。幀的組成:局部變量區(包括方法參數和局部變量,對於instance方法,還要首先保存this類型,其中方法參數按照聲明順序嚴格放置,局部變量能夠任意放置),操做數棧,幀數據區(用來幫助支持常量池的解析,正常方法返回和異常處理)。本地方法棧:依賴於本地方法的實現,如某個JVM實現的本地方法藉口使用C鏈接模型,則本地方法棧就是C棧,能夠說某線程在調用本地方法時,就進入了一個不受JVM限制的領域,也就是JVM能夠利用本地方法來動態擴展自己。安全