第六章字節碼執行方式--解釋執行和JIT

時間 2019-12-02

標籤第六字節執行方式解釋執行 jit 简体版

原文原文鏈接

注：主要參考自《分佈式java應用：基礎與實踐》《深刻理解Java虛擬機（第二版）》html

一、兩種執行方式：java

解釋執行（運行期解釋字節碼並執行）
- 強制使用該模式：-Xint
編譯爲機器碼執行（將字節碼編譯爲機器碼並執行，這個編譯過程發生在運行期，稱爲JIT編譯）
- 強制使用該模式：-Xcomp，下面是兩種編譯模式
- client（即C1）：只作少許性能開銷比高的優化，佔用內存少，適用於桌面程序。
- server（即C2）：進行了大量優化，佔用內存多，適用於服務端程序。會收集大量的運行時信息。

注意：分佈式

32爲機器默認選擇C1，可在啓動時添加-client或-server來指定，64位機器若CPU>2且物理內存>2G則默認爲C2，不然爲C1
Hotspot JVM執行代碼的機制：對在執行過程當中執行頻率高的代碼進行編譯，對執行頻率不高的代碼繼續解釋執行

查看當前機器默認是client模式仍是server模式，使用："java -version"命令，以下ide

其中，mixed mode表示"解釋執行+編譯執行"的混合模式性能

二、解釋執行優化

查看第三章類文件結構與javap的使用中的inc()方法的執行spa

或者查看《深刻了解java虛擬機（第二版）》P272-P275線程

三、編譯執行3d

編譯的對象
- 方法
- 方法中的循環體
  - OSR編譯：編譯整段代碼，可是隻有循環體部分會執行機器碼，其餘部分仍是解釋執行
觸發條件（執行頻率大於多少）
- 方法調用計數器：方法被調用的次數
  - client:1500 server:10000
  - 該閾值可經過-XX:CompileThreshold來指定
  - 這裏"方法調用的次數"是指一段時間（半衰週期）內的調用次數，若是半衰週期內，該次數沒有達到閾值，則該次數減半。
    - -XX:-UseCounterDecay 關閉上述機制，即半衰週期的無窮大
    - -XX:CounterHalfLifeTime 半衰週期
- 回邊計數器：循環體內循環代碼的執行次數（即for中代碼的循環的次數）
  - client:13995 server:10700
  - 該閾值可經過-XX:OnStackReplacePercent（注意該OSRP只是一個計算回邊計數閾值的中間值），回邊計數閾值
    - client：CompileThreshold*OSRP/100
    - server：CompileThreshold*(OSRP-InterPreterProfilePercentage)/100
    - -XX:OnStackReplacePercent:140 InterPreterProfilePercentage:33
方法編譯執行
- 解釋器調用方法時，檢查是否有已經存在的編譯版本，若是有，執行機器碼，若是沒有，方法調用計數器+1，而後判斷方法調用計數器是否超過閾值，若超過，進行編譯，後臺線程進行編譯，前臺線程繼續解釋執行（即不會阻塞），直到下一次調用方法時，若是編譯好了，就直接執行機器碼，若是沒編譯好，就解釋執行。
循環體編譯執行
- 解釋器執行到循環體時，檢查是否有已經存在的編譯版本，若是有，執行機器碼，若是沒有，回邊計數器+1，而後判斷回邊計數器是否超過閾值，若超過，進行編譯，後臺線程進行編譯，前臺線程繼續解釋執行（即不會阻塞），直到下一次執行到循環體時，若是編譯好了，就直接執行機器碼，若是沒編譯好，就解釋執行。

四、C1優化code

說明：關於所有的優化技術列表，查看《深刻理解java虛擬機（第二版）》P346-P347

只作少許性能開銷比高的優化，佔用內存少，主要的優化包括：

方法內聯
冗餘消除
複寫傳播
消除無用代碼
類型繼承關係分析（CHA，輔助）
去虛擬化

4.一、方法內聯、冗餘消除、複寫傳播、消除無用代碼

4.1.一、方法內聯

方法內聯含義：假設方法A調用了方法B，把B的指令直接植入到A中。

    static class B{
        int value;
        final int get() {
            return value;
        }
    }
    
    public void foo() {
        y = b.get();
        //do something
        z = b.get();
        sum = y + z;
    }

View Code

說明：在上述代碼中，b是B的一個實例。

方法內聯以後，

    public void foo() {
        y = b.value;
        //do something
        z = b.value;
        sum = y + z;
    }

View Code

方法內聯的條件：

get()編譯後的字節數<=35byte（默認） -XX:MaxInlineSize=35指定

方法內聯的地位：

優化系列中最一開始使用的方式（由於是不少其餘優化手段的基礎）
消除方法調用的成本（創建棧幀、避免參數傳遞、避免返回值傳遞、避免跳轉）

4.1.二、冗餘消除

冗餘消除：如上邊的兩個b.value冗餘（前提，在do something部分沒有對b.value進行操做，這也是咱們在作優化以前須要先收集數據的緣由）

假設在do something部分沒有對b.value進行操做，進行冗餘消除後，

    public void foo() {
        y = b.value;
        //do something
        z = y;
        sum = y + z;
    }

View Code

4.1.三、複寫傳播

固然，在冗餘消除後，JIT對上述的代碼進行分析，發現變量z沒用（能夠徹底用y來代替），進行"複寫傳播"以後，

    public void foo() {
        y = b.value;
        //do something
        y = y;
        sum = y + y;
    }

View Code

4.1.四、無用代碼消除

在"複寫傳播"後，發現"y=y"是無用代碼，因此能夠進行"無用代碼的消除"操做，消除以後，

    public void foo() {
        y = b.value;
        //do something
        sum = y + y;
    }

View Code

須要說明的是，這裏的"無用代碼的消除"是在前三部優化的基礎上來作的，而javac編譯中"語義分析"部分的"無用代碼的消除"是直接消除一些直接寫好的代碼（例如：if(false){}）

4.二、類型繼承關係分析、去虛擬化

public interface Animal {
    public void eat();
}

public class Cat implements Animal{
    public void eat() {
        System.out.println("cat eat fish");
    }
}

public class Test{
    public void methodA(Animal animal){
        animal.eat();
    }
}

View Code

首先分析Animal的整個"類型繼承關係"，發現只有一個實現類Cat，那麼在methodA(Animal animal)的代碼就能夠優化爲以下，

    public void methodA(Animal animal){
        System.out.println("cat eat fish");
    }

View Code

可是，若是以後在運行過程當中，"類型繼承關係"發現Animal又多了一個實現類Dog，那麼此時就不在執行以前優化編譯好的機器碼了，而是進行解釋執行，即以下的"逆優化"。

逆優化：

當編譯後的機器碼的執行再也不符合優化條件，則該機器碼對應的部分回到解釋執行。

eg.好比"去虛擬化"，若是編譯以後，發現類的實現方法多於一種了，此時就要執行"逆優化"

五、C2優化

進行了大量優化，佔用內存多，適用於服務端程序，對於C2優化，除了具備C1的優化措施後，還有不少優化。

逃逸分析（輔助）：

開啓：-XX:+DoEscapeAnalysis

根據運行情況來判斷方法中的變量是否會被方法或外部線程所讀取，若不會，此變量是不逃逸的。基於此，C2在編譯時會作：

標量替換：開啓 -XX:+EliminateAllocations
棧上分配
同步削除：開啓 -XX:+EliminateLocks

5.一、標量替換

含義：將一個java對象打散，根據程序，將該對象中的屬性做爲一個個標量來使用。

    Point point = new Point(1,2);
    System.out.println("point.x:" + point.x + ",point.y:" + point.y);
    //do after

View Code

若在//do after中（即前邊兩句代碼以後的全部代碼中）再沒有其餘代碼訪問"point對象"了，則將"point對象"打散並進行標量替換，

    int x = 1;
    int y = 2;
    System.out.println("point.x:" + x + ",point.y:" + y);

View Code

好處：

若是對象中定義的全部變量有的並無被用到，"標量替換"能夠節省內存
執行時，不須要尋找對象引用，速度會快

5.二、棧上分配

含義：肯定一個方法的變量不會逃逸出當前方法以外（即該變量不會被其餘方法引用），則該變量能夠直接分配在棧上，隨方法執行結束，棧幀消失，該變量也消失，減輕GC壓力。

好處：

執行時，不須要根據對象引用去堆中找對象，速度會快
分配在棧上，隨方法執行結束，棧幀消失，該變量也消失，減輕GC壓力。
使用棧上分配，必須開啓標量替換

5.三、同步削除

含義：肯定一個方法的變量不會逃逸出當前線程以外（即該變量不會被其餘線程使用），則對於該變量的同步策略就消除掉，以下，

    synchronized(cat){
        //do xxx
    }

View Code

若cat不會逃逸出當前線程，則同步塊能夠去掉，以下，

//do xxx

View Code

總結：

解釋器：

程序啓動速度比編譯快
節省內存（不須要編譯，因此不須要放置編譯後的機器碼）

JIT編譯器：

時間長了，對於"熱點代碼"的執行會快

注意：

使用JIT而不是使用在編譯期直接編譯成機器碼，除了解釋器部分的兩條有點外，還爲了在運行期收集數據，有目的的進行編譯

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

第六章 字節碼執行方式--解釋執行和JIT

第六章字節碼執行方式--解釋執行和JIT