深刻理解編譯優化之循環展開和粗化鎖

時間 2020-07-05

標籤深刻理解編譯優化循環展開简体版

原文原文鏈接

簡介

以前在講JIT的時候，有提到在編譯過程當中的兩種優化循環展開和粗化鎖，今天咱們和小師妹一塊兒從Assembly的角度來驗證一下這兩種編譯優化方法，快來看看吧。java

循環展開和粗化鎖

小師妹:F師兄，上次你講到在JIT編譯的過程當中會進行一些編譯上面的優化，其中就有循環展開和粗化鎖。我對這兩種優化方式很感興趣，能不能展開講解一下呢？git

更多精彩內容且看：程序員

固然能夠，咱們先來回顧一下什麼是循環展開。github

循環展開就是說，像下面的循環遍歷的例子：spring

for (int i = 0; i < 1000; i++) {
                x += 0x51;
        }

由於每次循環都須要作跳轉操做，因此爲了提高效率，上面的代碼其實能夠被優化爲下面的：jvm

for (int i = 0; i < 250; i++) {
                x += 0x144; //0x51 * 4
        }

注意上面咱們使用的是16進制數字，至於爲何要使用16進制呢？這是爲了方便咱們在後面的assembly代碼中快速找到他們。spring-boot

好了，咱們再在 x += 0x51 的外面加一層synchronized鎖，看一下synchronized鎖會不會隨着loop unrolling展開的同時被粗化。oop

for (int i = 0; i < 1000; i++) {
            synchronized (this) {
                x += 0x51;
            }
 }

萬事具有，只欠咱們的運行代碼了，這裏咱們仍是使用JMH來執行。區塊鏈

相關代碼以下：優化

@Warmup(iterations = 10, time = 1, timeUnit = TimeUnit.SECONDS)
@Measurement(iterations = 5, time = 1, timeUnit = TimeUnit.SECONDS)
@Fork(value = 1,
        jvmArgsPrepend = {
        "-XX:-UseBiasedLocking",
                "-XX:CompileCommand=print,com.flydean.LockOptimization::test"
}
        )
@State(Scope.Benchmark)
@BenchmarkMode(Mode.AverageTime)
@OutputTimeUnit(TimeUnit.NANOSECONDS)
public class LockOptimization {

    int x;
    @Benchmark
    @CompilerControl(CompilerControl.Mode.DONT_INLINE)
    public void test() {
        for (int i = 0; i < 1000; i++) {
            synchronized (this) {
                x += 0x51;
            }
        }
    }

    public static void main(String[] args) throws RunnerException {
        Options opt = new OptionsBuilder()
                .include(LockOptimization.class.getSimpleName())
                .build();
        new Runner(opt).run();
    }
}

上面的代碼中，咱們取消了偏向鎖的使用：-XX:-UseBiasedLocking。爲啥要取消這個選項呢？由於若是在偏向鎖的狀況下，若是線程得到鎖以後，在以後的執行過程當中，若是沒有其餘的線程訪問該鎖，那麼持有偏向鎖的線程則不須要觸發同步。

爲了更好的理解synchronized的流程，這裏咱們將偏向鎖禁用。

其餘的都是咱們以前講過的JMH的常規操做。

接下來就是見證奇蹟的時刻了。

分析Assembly日誌

咱們運行上面的程序，將會獲得一系列的輸出。由於本文並非講解Assembly語言的，因此本文只是大概的理解一下Assembly的使用，並不會詳細的進行Assembly語言的介紹，若是有想深刻了解Assembly的朋友，能夠在文後留言。

分析Assembly的輸出結果，咱們能夠看到結果分爲C1-compiled nmethod和C2-compiled nmethod兩部分。

先看C1-compiled nmethod：

第一行是monitorenter,表示進入鎖的範圍，後面還跟着對於的代碼行數。

最後一行是monitorexit,表示退出鎖的範圍。

中間有個add $0x51,%eax操做，對於着咱們的代碼中的add操做。

能夠看到C1—compiled nmethod中是沒有進行Loop unrolling的。

咱們再看看C2-compiled nmethod:

和C1很相似，不一樣的是add的值變成了0x144,說明進行了Loop unrolling，同時對應的鎖範圍也跟着進行了擴展。

最後看下運行結果：

Benchmark              Mode  Cnt     Score     Error  Units
LockOptimization.test  avgt    5  5601.819 ± 620.017  ns/op

得分還不錯。

禁止Loop unrolling

接下來咱們看下若是將Loop unrolling禁掉，會獲得什麼樣的結果。

要禁止Loop unrolling，只須要設置-XX:LoopUnrollLimit=1便可。

咱們再運行一下上面的程序:

能夠看到C2-compiled nmethod中的數字變成了本來的0x51，說明並無進行Loop unrolling。

再看看運行結果：

Benchmark              Mode  Cnt      Score      Error  Units
LockOptimization.test  avgt    5  20846.709 ± 3292.522  ns/op

能夠看到運行時間基本是優化事後的4倍左右。說明Loop unrolling仍是很是有用的。

總結

本文介紹了循環展開和粗化鎖的實際例子，但願你們可以喜歡。

本文的例子https://github.com/ddean2009/learn-java-base-9-to-20

本文做者：flydean程序那些事
本文連接：http://www.flydean.com/jvm-jit-loop-unrolling-lock-coarsening/

本文來源：flydean的博客

歡迎關注個人公衆號:程序那些事，更多精彩等着您！

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。