以前在講JIT的時候,有提到在編譯過程當中的兩種優化循環展開和粗化鎖,今天咱們和小師妹一塊兒從Assembly的角度來驗證一下這兩種編譯優化方法,快來看看吧。java
小師妹:F師兄,上次你講到在JIT編譯的過程當中會進行一些編譯上面的優化,其中就有循環展開和粗化鎖。我對這兩種優化方式很感興趣,能不能展開講解一下呢?git
更多精彩內容且看:程序員
固然能夠,咱們先來回顧一下什麼是循環展開。github
循環展開就是說,像下面的循環遍歷的例子:spring
for (int i = 0; i < 1000; i++) { x += 0x51; }
由於每次循環都須要作跳轉操做,因此爲了提高效率,上面的代碼其實能夠被優化爲下面的:jvm
for (int i = 0; i < 250; i++) { x += 0x144; //0x51 * 4 }
注意上面咱們使用的是16進制數字,至於爲何要使用16進制呢?這是爲了方便咱們在後面的assembly代碼中快速找到他們。spring-boot
好了,咱們再在 x += 0x51 的外面加一層synchronized鎖,看一下synchronized鎖會不會隨着loop unrolling展開的同時被粗化。oop
for (int i = 0; i < 1000; i++) { synchronized (this) { x += 0x51; } }
萬事具有,只欠咱們的運行代碼了,這裏咱們仍是使用JMH來執行。區塊鏈
相關代碼以下:優化
@Warmup(iterations = 10, time = 1, timeUnit = TimeUnit.SECONDS) @Measurement(iterations = 5, time = 1, timeUnit = TimeUnit.SECONDS) @Fork(value = 1, jvmArgsPrepend = { "-XX:-UseBiasedLocking", "-XX:CompileCommand=print,com.flydean.LockOptimization::test" } ) @State(Scope.Benchmark) @BenchmarkMode(Mode.AverageTime) @OutputTimeUnit(TimeUnit.NANOSECONDS) public class LockOptimization { int x; @Benchmark @CompilerControl(CompilerControl.Mode.DONT_INLINE) public void test() { for (int i = 0; i < 1000; i++) { synchronized (this) { x += 0x51; } } } public static void main(String[] args) throws RunnerException { Options opt = new OptionsBuilder() .include(LockOptimization.class.getSimpleName()) .build(); new Runner(opt).run(); } }
上面的代碼中,咱們取消了偏向鎖的使用:-XX:-UseBiasedLocking。爲啥要取消這個選項呢?由於若是在偏向鎖的狀況下,若是線程得到鎖以後,在以後的執行過程當中,若是沒有其餘的線程訪問該鎖,那麼持有偏向鎖的線程則不須要觸發同步。
爲了更好的理解synchronized的流程,這裏咱們將偏向鎖禁用。
其餘的都是咱們以前講過的JMH的常規操做。
接下來就是見證奇蹟的時刻了。
咱們運行上面的程序,將會獲得一系列的輸出。由於本文並非講解Assembly語言的,因此本文只是大概的理解一下Assembly的使用,並不會詳細的進行Assembly語言的介紹,若是有想深刻了解Assembly的朋友,能夠在文後留言。
分析Assembly的輸出結果,咱們能夠看到結果分爲C1-compiled nmethod和C2-compiled nmethod兩部分。
先看C1-compiled nmethod:
第一行是monitorenter,表示進入鎖的範圍,後面還跟着對於的代碼行數。
最後一行是monitorexit,表示退出鎖的範圍。
中間有個add $0x51,%eax操做,對於着咱們的代碼中的add操做。
能夠看到C1—compiled nmethod中是沒有進行Loop unrolling的。
咱們再看看C2-compiled nmethod:
和C1很相似,不一樣的是add的值變成了0x144,說明進行了Loop unrolling,同時對應的鎖範圍也跟着進行了擴展。
最後看下運行結果:
Benchmark Mode Cnt Score Error Units LockOptimization.test avgt 5 5601.819 ± 620.017 ns/op
得分還不錯。
接下來咱們看下若是將Loop unrolling禁掉,會獲得什麼樣的結果。
要禁止Loop unrolling,只須要設置-XX:LoopUnrollLimit=1便可。
咱們再運行一下上面的程序:
能夠看到C2-compiled nmethod中的數字變成了本來的0x51,說明並無進行Loop unrolling。
再看看運行結果:
Benchmark Mode Cnt Score Error Units LockOptimization.test avgt 5 20846.709 ± 3292.522 ns/op
能夠看到運行時間基本是優化事後的4倍左右。說明Loop unrolling仍是很是有用的。
本文介紹了循環展開和粗化鎖的實際例子,但願你們可以喜歡。
本文的例子https://github.com/ddean2009/learn-java-base-9-to-20
本文做者:flydean程序那些事本文連接:http://www.flydean.com/jvm-jit-loop-unrolling-lock-coarsening/
本文來源:flydean的博客
歡迎關注個人公衆號:程序那些事,更多精彩等着您!