Java併發藝術-CAS

時間 2019-12-05

標籤 java 併發藝術 cas 欄目 Java 简体版

原文原文鏈接

前言

CAS（Compare and Swap），即比較並替換，實現併發算法時經常使用到的一種技術，Doug lea大神在java同步器中大量使用了CAS技術，鬼斧神工的實現了多線程執行的安全性。php

CAS的思想很簡單：三個參數，一個當前內存值V、舊的預期值A、即將更新的值B，當且僅當預期值A和內存值V相同時，將內存值修改成B並返回true，不然什麼都不作，並返回false。java

問題

一個n++的問題。算法

public class Case { public volatile int n; public void add() { n++; } }

經過javap -verbose Case看看add方法的字節碼指令緩存

public void add(); flags: ACC_PUBLIC Code: stack=3, locals=1, args_size=1 0: aload_0 1: dup 2: getfield #2 // Field n:I 5: iconst_1 6: iadd 7: putfield #2 // Field n:I 10: return

n++被拆分紅了幾個指令：安全

執行getfield拿到原始n；
執行iadd進行加1操做；
執行putfield寫把累加後的值寫回n；

經過volatile修飾的變量能夠保證線程之間的可見性，但並不能保證這3個指令的原子執行，在多線程併發執行下，沒法作到線程安全，獲得正確的結果，那麼應該如何解決呢？多線程

如何解決

在add方法加上synchronized修飾解決。併發

public class Case { public volatile int n;  public synchronized void add() { n++; } }

這個方案固然可行，可是性能上差了點，還有其它方案麼？app

再來看一段代碼函數

public int a = 1; public boolean compareAndSwapInt(int b) { if (a == 1) { a = b; return true; } return false; }

若是這段代碼在併發下執行，會發生什麼？oop

假設線程1和線程2都過了a==1的檢測，都準備執行對a進行賦值，結果就是兩個線程同時修改了變量a，顯然這種結果是沒法符合預期的，沒法肯定a的最終值。

解決方法也一樣暴力，在compareAndSwapInt方法加鎖同步，變成一個原子操做，同一時刻只有一個線程才能修改變量a。

除了低性能的加鎖方案，咱們還可使用JDK自帶的CAS方案，在CAS中，比較和替換是一組原子操做，不會被外部打斷，且在性能上更佔有優點。

下面以AtomicInteger的實現爲例，分析一下CAS是如何實現的。

public class AtomicInteger extends Number implements java.io.Serializable { // setup to use Unsafe.compareAndSwapInt for updates private static final Unsafe unsafe = Unsafe.getUnsafe(); private static final long valueOffset; static { try { valueOffset = unsafe.objectFieldOffset (AtomicInteger.class.getDeclaredField("value")); } catch (Exception ex) { throw new Error(ex); } } private volatile int value; public final int get() {return value;} }

Unsafe，是CAS的核心類，因爲Java方法沒法直接訪問底層系統，須要經過本地（native）方法來訪問，Unsafe至關於一個後門，基於該類能夠直接操做特定內存的數據。
變量valueOffset，表示該變量值在內存中的偏移地址，由於Unsafe就是根據內存偏移地址獲取數據的。
變量value用volatile修飾，保證了多線程之間的內存可見性。

看看AtomicInteger如何實現併發下的累加操做：

public final int getAndAdd(int delta) { return unsafe.getAndAddInt(this, valueOffset, delta); } //unsafe.getAndAddInt public final int getAndAddInt(Object var1, long var2, int var4) { int var5; do { var5 = this.getIntVolatile(var1, var2); } while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4)); return var5; }

假設線程A和線程B同時執行getAndAdd操做（分別跑在不一樣CPU上）：

AtomicInteger裏面的value原始值爲3，即主內存中AtomicInteger的value爲3，根據Java內存模型，線程A和線程B各自持有一份value的副本，值爲3。
線程A經過getIntVolatile(var1, var2)拿到value值3，這時線程A被掛起。
線程B也經過getIntVolatile(var1, var2)方法獲取到value值3，運氣好，線程B沒有被掛起，並執行compareAndSwapInt方法比較內存值也爲3，成功修改內存值爲2。
這時線程A恢復，執行compareAndSwapInt方法比較，發現本身手裏的值(3)和內存的值(2)不一致，說明該值已經被其它線程提早修改過了，那隻能從新來一遍了。
從新獲取value值，由於變量value被volatile修飾，因此其它線程對它的修改，線程A老是可以看到，線程A繼續執行compareAndSwapInt進行比較替換，直到成功。

整個過程當中，利用CAS保證了對於value的修改的併發安全，繼續深刻看看Unsafe類中的compareAndSwapInt方法實現。

public final native boolean compareAndSwapInt(Object paramObject, long paramLong, int paramInt1, int paramInt2);

Unsafe類中的compareAndSwapInt，是一個本地方法，該方法的實現位於unsafe.cpp中

UNSAFE_ENTRY(jboolean, Unsafe_CompareAndSwapInt(JNIEnv *env, jobject unsafe, jobject obj, jlong offset, jint e, jint x))
  UnsafeWrapper("Unsafe_CompareAndSwapInt"); oop p = JNIHandles::resolve(obj); jint* addr = (jint *) index_oop_from_field_offset_long(p, offset); return (jint)(Atomic::cmpxchg(x, addr, e)) == e; UNSAFE_END

先想辦法拿到變量value在內存中的地址。
經過Atomic::cmpxchg實現比較替換，其中參數x是即將更新的值，參數e是原內存的值。

若是是Linux的x86，Atomic::cmpxchg方法的實現以下：

inline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint compare_value) { int mp = os::is_MP(); __asm__ volatile (LOCK_IF_MP(%4) "cmpxchgl %1,(%3)" : "=a" (exchange_value) : "r" (exchange_value), "a" (compare_value), "r" (dest), "r" (mp) : "cc", "memory"); return exchange_value; }

看到這彙編，心裏崩潰 😖

__asm__表示彙編的開始
volatile表示禁止編譯器優化
LOCK_IF_MP是個內聯函數

#define LOCK_IF_MP(mp) "cmp $0, " #mp "; je 1f; lock; 1: "

Window的x86實現以下：

inline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint compare_value) { int mp = os::isMP(); //判斷是不是多處理器 _asm { mov edx, dest mov ecx, exchange_value mov eax, compare_value LOCK_IF_MP(mp) cmpxchg dword ptr [edx], ecx } } // Adding a lock prefix to an instruction on MP machine // VC++ doesn't like the lock prefix to be on a single line // so we can't insert a label after the lock prefix. // By emitting a lock prefix, we can define a label after it. #define LOCK_IF_MP(mp) __asm cmp mp, 0 \ __asm je L0 \ __asm _emit 0xF0 \ __asm L0:

LOCK_IF_MP根據當前系統是否爲多核處理器決定是否爲cmpxchg指令添加lock前綴。

若是是多處理器，爲cmpxchg指令添加lock前綴。
反之，就省略lock前綴。（單處理器會不須要lock前綴提供的內存屏障效果）

intel手冊對lock前綴的說明以下：

確保後續指令執行的原子性。
在Pentium及以前的處理器中，帶有lock前綴的指令在執行期間會鎖住總線，使得其它處理器暫時沒法經過總線訪問內存，很顯然，這個開銷很大。在新的處理器中，Intel使用緩存鎖定來保證指令執行的原子性，緩存鎖定將大大下降lock前綴指令的執行開銷。
禁止該指令與前面和後面的讀寫指令重排序。
把寫緩衝區的全部數據刷新到內存中。

上面的第2點和第3點所具備的內存屏障效果，保證了CAS同時具備volatile讀和volatile寫的內存語義。

CAS缺點

CAS存在一個很明顯的問題，即ABA問題。

問題：若是變量V初次讀取的時候是A，而且在準備賦值的時候檢查到它仍然是A，那能說明它的值沒有被其餘線程修改過了嗎？

若是在這段期間曾經被改爲B，而後又改回A，那CAS操做就會誤認爲它歷來沒有被修改過。針對這種狀況，java併發包中提供了一個帶有標記的原子引用類AtomicStampedReference，它能夠經過控制變量值的版原本保證CAS的正確性。

做者：佔小狼連接：https://www.jianshu.com/p/fb6e91b013cc來源：簡書著做權歸做者全部。商業轉載請聯繫做者得到受權，非商業轉載請註明出處。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。