簡介:java
編譯包括兩種狀況: 1,源碼編譯成字節碼 2,字節碼編譯成本地機器碼(符合本地系統專屬的指令) 解釋執行也包括兩種狀況: 1,源碼解釋執行 2,字節碼解釋執行 解釋和編譯執行的區別是:是否產生中間本地機器碼。
大部分的程序代碼從開始編譯到最終轉化成物理機的目標代碼或虛擬機能執行的指令集以前,都會按照以下圖所示的各個步驟進行:後端
其中綠色的模塊能夠選擇性實現。緩存
在執行前先對程序源碼進行詞法解析和語法解析處理,把源碼轉化爲抽象語法樹。
對於一門具體語言的實現來講:函數
在Java中提到「編譯」,天然很容易想到Javac編譯器將*.java文件編譯成爲*.class文件的過程,優化
1,這裏的Javac編譯器稱爲前端編譯器,其餘的前端編譯器還有諸如Eclipse JDT中的增量式編譯器ECJ等。
2,相對應的還有後端編譯器,它在程序運行期間將字節碼轉變成機器碼(如今的Java程序在運行時基本都是解釋執行加編譯執行),
如HotSpot虛擬機自帶的JIT(Just In Time Compiler)編譯器(分Client端和Server端)。
3,有時候還有靜態提早編譯器(AOT,Ahead Of Time Compiler)直接把*.java文件編譯成本地機器代碼,如GCJ、Excelsior JET等,這類編譯器咱們應該比較少遇到。
1,詞法、語法分析spa
詞法分析是將源代碼的字符流轉變爲標記(Token)集合。.net
單個字符是程序編寫過程當中的的最小元素,而標記則是編譯過程的最小元素,關鍵字、變量名、字面量、運算符等均可以成爲標記,
好比整型標誌int由三個字符構成,可是它只是一個標記,不可拆分。
語法分析是根據Token序列來構造抽象語法樹的過程。線程
抽象語法樹是一種用來描述程序代碼語法結構的樹形表示方式,語法樹的每個節點都表明着程序代碼中的一個語法結構,如類型、修飾符、運算符等。
通過這個步驟後,編譯器就基本不會再對源碼文件進行操做了,後續的操做都創建在抽象語法樹之上。code
2,填充符號表
完成了語法分析和詞法分析以後,下一步就是填充符號表的過程。
符號表是由一組符號地址和符號信息構成的表格。
符號表中所登記的信息在編譯的不一樣階段都要用到,在語義分析(後面的步驟)中,符號表所登記的內容將用於語義檢查和產生中間代碼,
在目標代碼生成階段,對符號名進行地址分配時,符號表是地址分配的依據。
好比:默認構造器的添加。
3,語義分析
語法樹能表示一個結構正確的源程序的抽象,但沒法保證源程序是符合邏輯的。
而語義分析的主要任務是:
對結構上正確的源程序進行上下文有關性的審查。
語義分析過程分爲標註檢查和數據及控制流分析兩個步驟:
1,標註檢查的內容包括諸如:變量使用前是否已被聲明、變量和賦值之間的數據類型是否匹配等。
2,數據及控制流分析是對程序上下文邏輯更進一步的驗證,
檢查出諸如:程序局部變量在使用前是否有賦值、方法的每條路徑是否都有返回值、是否全部的受查異常都被正確處理了等問題。
4,字節碼生成
字節碼生成是Javac編譯過程的最後一個階段。
字節碼生成階段不只僅是把前面各個步驟所生成的信息轉化成字節碼寫到磁盤中,編譯器還進行了少許的代碼添加和轉換工做。
若是用戶代碼中沒有提供任何構造函數,那編譯器會自動添加一個沒有參數、訪問權限與當前類一致的默認構造函數,這個工做在填充符號表階段就已經完成了。
1,即時編譯的產生:
Java程序最初是僅僅經過解釋器解釋執行的,即對字節碼逐條解釋執行,這種方式的執行速度相對會比較慢,
尤爲當某個方法或代碼塊運行的特別頻繁時,這種方式的執行效率就顯得很低。
因而後來在虛擬機中引入了JIT編譯器(即時編譯器),
當虛擬機發現某個方法或代碼塊運行特別頻繁時,就會把這些代碼認定爲「Hot Spot Code」(熱點代碼),
爲了提升熱點代碼的執行效率,在運行時,虛擬機將會把這些代碼編譯成與本地平臺相關的機器碼,並進行各層次的優化,完成這項任務的正是JIT編譯器。
PS:區別是:即時編譯生成機器相關的中間碼,可重複執行緩存效率高。解釋執行直接執行字節碼,重複執行須要重複解釋。
如今主流的商用虛擬機(如Sun HotSpot、IBM J9)中幾乎都同時包含解釋器和編譯器
(三大商用虛擬機之一的JRockit是個例外,它內部沒有解釋器,所以會有啓動相應時間長,但它主要是面向服務端的應用,這類應用通常不會重點關注啓動時間)。
兩者各有優點:
解釋執行能夠節約內存,而編譯執行能夠提高效率。
目前主流的HotSpot虛擬機中默認是採用解釋器與其中一個編譯器直接配合的方式工做。
2,運行過程當中會被即時編譯器編譯的「熱點代碼」有兩類:
被屢次調用的方法。
被屢次調用的循環體。
兩種狀況,編譯器都是以整個方法做爲編譯對象,這種編譯也是虛擬機中標準的編譯方式。
一段代碼或方法是否是熱點代碼,是否是須要觸發即時編譯,須要進行Hot Spot Detection(熱點探測)。
3,目前主要的熱點 斷定方式有如下兩種:
3,1,基於採樣的熱點探測:
虛擬機會週期性地檢查各個線程的棧頂,若是發現某些方法常常出如今棧頂,那這段方法代碼就是「熱點代碼」。
3,2,基於計數器的熱點探測:
虛擬機會爲每一個方法,甚至是代碼塊創建計數器,統計方法的執行次數,
若是執行次數超過必定的閥值,就認爲它是「熱點方法」。
這種統計方法實現複雜一些,須要爲每一個方法創建並維護計數器,並且不能直接獲取到方法的調用關係,可是它的統計結果相對更加精確嚴謹。
4,在HotSpot虛擬機中使用的是第二種——基於計數器的熱點探測方法的兩個計數器:
方法調用計數器和回邊計數器。
4,1,方法調用計數器:
用來統計方法調用的次數,在默認設置下,方法調用計數器統計的並非方法被調用的絕對次數,而是一個相對的執行頻率,即一段時間內方法被調用的次數。
4,2,回邊計數器:
用於統計一個方法中循環體代碼執行的次數.
(準確地說,應該是回邊的次數,由於並不是全部的循環都是回邊),
在字節碼中遇到控制流向後跳轉的指令就稱爲「回邊」。
在肯定虛擬機運行參數的前提下,這兩個計數器都有一個肯定的閥值,當計數器的值超過了閥值,就會觸發JIT編譯。
5,即時編譯和解釋執行的執行順序:
6,方法調用計數器觸發即時編譯的流程:
方法計數器觸發即時編譯的過程與回邊計數器觸發即時編譯的過程相似