衆所周知,Java是多線程的。可是,Java對多線程的支持實際上是一把雙刃劍。一旦涉及到多個線程操做共享資源的狀況時,處理很差就可能產生線程安全問題。線程安全性多是很是複雜的,在沒有充足的同步的狀況下,多個線程中的操做執行順序是不可預測的。html
Java裏面進行多線程通訊的主要方式就是共享內存的方式,共享內存主要的關注點有兩個:可見性和有序性。加上覆合操做的原子性,咱們能夠認爲Java的線程安全性問題主要關注點有3個:可見性、有序性和原子性。java
Java內存模型(JMM)解決了可見性和有序性的問題,而鎖解決了原子性的問題。算法
悲觀鎖:老是假設最壞的狀況,每次去拿數據的時候都認爲別人會修改,因此每次在拿數據的時候都會上鎖,這樣別人想拿這個數據就會阻塞直到它拿到鎖。傳統的關係型數據庫裏邊就用到了不少這種鎖機制,好比行鎖,表鎖等,讀鎖,寫鎖等,都是在作操做以前先上鎖。再好比Java裏面的同步原語synchronized關鍵字的實現也是悲觀鎖。數據庫
樂觀鎖:顧名思義,就是很樂觀,每次去拿數據的時候都認爲別人不會修改,因此不會上鎖,可是在更新的時候會判斷一下在此期間別人有沒有去更新這個數據,可使用版本號等機制。樂觀鎖適用於多讀的應用類型,這樣能夠提升吞吐量,像數據庫提供的相似於write_condition機制,其實都是提供的樂觀鎖。在Java中java.util.concurrent.atomic包下面的原子變量類就是使用了樂觀鎖的一種實現方式CAS實現的。編程
Java在JDK1.5以前都是靠synchronized關鍵字保證同步的,這種經過使用一致的鎖定協議來協調對共享狀態的訪問,能夠確保不管哪一個線程持有共享變量的鎖,都採用獨佔的方式來訪問這些變量。獨佔鎖其實就是一種悲觀鎖,因此能夠說synchronized是悲觀鎖。緩存
悲觀鎖機制存在如下問題:安全
一、在多線程競爭下,加鎖、釋放鎖會致使比較多的上下文切換和調度延時,引發性能問題。數據結構
二、一個線程持有鎖會致使其它全部須要此鎖的線程掛起。多線程
三、若是一個優先級高的線程等待一個優先級低的線程釋放鎖會致使優先級倒置,引發性能風險。併發
而另外一個更加有效的鎖就是樂觀鎖。所謂樂觀鎖就是,每次不加鎖而是假設沒有衝突而去完成某項操做,若是由於衝突失敗就重試,直到成功爲止。
與鎖相比,volatile變量是一個更輕量級的同步機制,由於在使用這些變量時不會發生上下文切換和線程調度等操做,可是volatile不能解決原子性問題,所以當一個變量依賴舊值時就不能使用volatile變量。所以對於同步最終仍是要回到鎖機制上來。
樂觀鎖( Optimistic Locking)在上文已經說過了,其實就是一種思想。相對悲觀鎖而言,樂觀鎖假設認爲數據通常狀況下不會產生併發衝突,因此在數據進行提交更新的時候,纔會正式對數據是否產生併發衝突進行檢測,若是發現併發衝突了,則讓返回用戶錯誤的信息,讓用戶決定如何去作。
上面提到的樂觀鎖的概念中其實已經闡述了它的具體實現細節:主要就是兩個步驟:衝突檢測和數據更新。其實現方式有一種比較典型的就是 Compare and Swap ( CAS )。
CAS(Compare And Swap),即比較並交換。是解決多線程並行狀況下使用鎖形成性能損耗的一種機制,CAS操做包含三個操做數——內存位置(V)、預期原值(A)和新值(B)。若是內存位置的值與預期原值相匹配,那麼處理器會自動將該位置值更新爲新值。不然,處理器不作任何操做。不管哪一種狀況,它都會在CAS指令以前返回該位置的值。CAS有效地說明了「我認爲位置V應該包含值A;若是包含該值,則將B放到這個位置;不然,不要更改該位置,只告訴我這個位置如今的值便可」。這其實和樂觀鎖的衝突檢查+數據更新的原理是同樣的。
在JDK1.5 中新增 java.util.concurrent (J.U.C)就是創建在CAS之上的。相對於對於 synchronized 這種阻塞算法,CAS是非阻塞算法的一種常見實現。因此J.U.C在性能上有了很大的提高。
非阻塞算法 (nonblocking algorithms)
一個線程的失敗或者掛起不該該影響其餘線程的失敗或掛起的算法。
以 java.util.concurrent 中的 AtomicInteger 爲例,看一下在不使用鎖的狀況下是如何保證線程安全的。主要理解 getAndIncrement 方法,該方法的做用至關於 ++i 操做。
public class AtomicInteger extends Number implements java.io.Serializable { private volatile int value; public final int get() { return value; } public final int getAndIncrement() { for (;;) { int current = get(); int next = current + 1; if (compareAndSet(current, next)) return current; } } public final boolean compareAndSet(int expect, int update) { return unsafe.compareAndSwapInt(this, valueOffset, expect, update); } }
在沒有鎖的機制下,字段value要藉助volatile原語,保證線程間的數據是可見性。這樣在獲取變量的值的時候才能直接讀取。而後來看看 ++i 是怎麼作到的。
getAndIncrement 採用了CAS操做,每次從內存中讀取數據而後將此數據和 +1 後的結果進行CAS操做,若是成功就返回結果,不然重試直到成功爲止。
而 compareAndSet 利用JNI(Java Native Interface)來完成CPU指令的操做:
private static final Unsafe unsafe = Unsafe.getUnsafe(); private static final long valueOffset; static { try { valueOffset = unsafe.objectFieldOffset (AtomicInteger.class.getDeclaredField("value")); } catch (Exception ex) { throw new Error(ex); } } private volatile int value; public final boolean compareAndSet(int expect, int update) { return unsafe.compareAndSwapInt(this, valueOffset, expect, update); }
首先能夠看到AtomicInteger類在域中聲明瞭這兩個私有變量unsafe和valueOffset。其中unsafe實例採用Unsafe類中靜態方法getUnsafe()獲得,可是這個方法若是咱們寫的時候調用會報錯,由於這個方法在調用時會判斷類加載器,咱們的代碼是沒有「受信任」的,而在jdk源碼中調用是沒有任何問題的;valueOffset這個是指類中相應字段在該類的偏移量,在這裏具體便是指value這個字段在AtomicInteger類的內存中相對於該類首地址的偏移量。
而後能夠看一個有一個靜態初始化塊,這個塊的做用便是求出value這個字段的偏移量。具體的方法使用的反射的機制獲得value的Field對象,再根據objectFieldOffset這個方法求出value這個變量內存中在該對象中的偏移量。
其中unsafe.compareAndSwapInt(this, valueOffset, expect, update);相似以下邏輯:
if (this == expect) { this = update return true; } else { return false; }
那麼比較this == expect,替換this = update,compareAndSwapInt實現這兩個步驟的原子性呢? 參考CAS的原理
CAS原理:
CAS經過調用JNI的代碼實現的。而compareAndSwapInt就是藉助C來調用CPU底層指令實現的。
下面從分析比較經常使用的CPU(intel x86)來解釋CAS的實現原理。
下面是sun.misc.Unsafe類的compareAndSwapInt()方法的源代碼:
public final native boolean compareAndSwapInt(Object o, long offset, int expected, int x);
能夠看到這是個本地方法調用。這個本地方法在JDK中依次調用的C++代碼爲:
#define LOCK_IF_MP(mp) __asm cmp mp, 0 \ __asm je L0 \ __asm _emit 0xF0 \ __asm L0: inline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint compare_value) { // alternative for InterlockedCompareExchange int mp = os::is_MP(); __asm { mov edx, dest mov ecx, exchange_value mov eax, compare_value LOCK_IF_MP(mp) cmpxchg dword ptr [edx], ecx } }
如上面源代碼所示,程序會根據當前處理器的類型來決定是否爲cmpxchg指令添加lock前綴。若是程序是在多處理器上運行,就爲cmpxchg指令加上lock前綴(lock cmpxchg)。反之,若是程序是在單處理器上運行,就省略lock前綴(單處理器自身會維護單處理器內的順序一致性,不須要lock前綴提供的內存屏障效果)。
好比說一個線程one從內存位置V中取出A,這時候另外一個線程two也從內存中取出A,而且two進行了一些操做變成了B,而後two又將V位置的數據變成A,這時候線程one進行CAS操做發現內存中仍然是A,而後one操做成功。儘管線程one的CAS操做成功,但可能存在潛藏的問題。
好比說一個線程one從內存位置V中取出A,這時候另外一個線程two也從內存中取出A,而且two進行了一些操做變成了B,而後two又將V位置的數據變成A,這時候線程one進行CAS操做發現內存中仍然是A,而後one操做成功。儘管線程one的CAS操做成功,但可能存在潛藏的問題。以下所示:
現有一個用單向鏈表實現的堆棧,棧頂爲A,這時線程T1已經知道A.next爲B,而後但願用CAS將棧頂替換爲B:
head.compareAndSet(A,B);
在T1執行上面這條指令以前,線程T2介入,將A、B出棧,再pushD、C、A,此時堆棧結構以下圖,而對象B此時處於遊離狀態:
此時輪到線程T1執行CAS操做,檢測發現棧頂仍爲A,因此CAS成功,棧頂變爲B,但實際上B.next爲null,因此此時的狀況變爲:
其中堆棧中只有B一個元素,C和D組成的鏈表再也不存在於堆棧中,無緣無故就把C、D丟掉了。
以上就是因爲ABA問題帶來的隱患,各類樂觀鎖的實現中一般都會用版本戳version來對記錄或對象標記,避免併發操做帶來的問題。
所以AtomicStampedReference/AtomicMarkableReference就頗有用了。能夠用來避免ABA問題。
AtomicMarkableReference
類描述的一個<Object,Boolean>的對,能夠原子的修改Object或者Boolean的值,這種數據結構在一些緩存或者狀態描述中比較有用。這種結構在單個或者同時修改Object/Boolean的時候可以有效的提升吞吐量。AtomicStampedReference
類維護帶有整數「標誌」的對象引用,能夠用原子方式對其進行更新。對比AtomicMarkableReference 類的<Object,Boolean>,AtomicStampedReference維護的是一種相似<Object,int>的數據結構,其實就是對對象(引用)的一個併發計數(標記版本戳stamp)。可是與AtomicInteger 不一樣的是,此數據結構能夠攜帶一個對象引用(Object),而且可以對此對象和計數同時進行原子操做。
以AtomicStampedReference爲例。從Java1.5開始JDK的atomic包裏提供了一個類AtomicStampedReference,它經過包裝[E,Integer]的元組來對對象標記版本戳stamp,從而避免ABA問題。這個類的compareAndSet方法是首先檢查當前引用是否等於預期引用,而且當前標誌是否等於預期標誌,若是所有相等,則以原子方式將該引用和該標誌的值設置爲給定的更新值。
public boolean compareAndSet( V expectedReference,//預期引用 V newReference,//更新後的引用 int expectedStamp, //預期標誌 int newStamp //更新後的標誌 )
例以下面的代碼分別用AtomicInteger和AtomicStampedReference來對初始值爲100的原子整型變量進行更新,AtomicInteger會成功執行CAS操做,而加上版本戳的AtomicStampedReference對於ABA問題會執行CAS失敗:
package concur.lock; import java.util.concurrent.TimeUnit; import java.util.concurrent.atomic.AtomicInteger; import java.util.concurrent.atomic.AtomicStampedReference; public class ABA { private static AtomicInteger atomicInt = new AtomicInteger(100); private static AtomicStampedReference<Integer> atomicStampedRef = new AtomicStampedReference<Integer>(100, 0); public static void main(String[] args) throws InterruptedException { Thread intT1 = new Thread(new Runnable() { @Override public void run() { atomicInt.compareAndSet(100, 101); atomicInt.compareAndSet(101, 100); } }); Thread intT2 = new Thread(new Runnable() { @Override public void run() { try { TimeUnit.SECONDS.sleep(1); } catch (InterruptedException e) { e.printStackTrace(); } boolean c3 = atomicInt.compareAndSet(100, 101); System.out.println(c3); //true } }); intT1.start(); intT2.start(); intT1.join(); intT2.join(); Thread refT1 = new Thread(new Runnable() { @Override public void run() { try { TimeUnit.SECONDS.sleep(1); } catch (InterruptedException e) { e.printStackTrace(); } atomicStampedRef.compareAndSet(100, 101, atomicStampedRef.getStamp(), atomicStampedRef.getStamp()+1); atomicStampedRef.compareAndSet(101, 100, atomicStampedRef.getStamp(), atomicStampedRef.getStamp()+1); } }); Thread refT2 = new Thread(new Runnable() { @Override public void run() { int stamp = atomicStampedRef.getStamp(); System.out.println("before sleep : stamp = " + stamp); // stamp = 0 try { TimeUnit.SECONDS.sleep(2); } catch (InterruptedException e) { e.printStackTrace(); } System.out.println("after sleep : stamp = " + atomicStampedRef.getStamp());//stamp = 1 boolean c3 = atomicStampedRef.compareAndSet(100, 101, stamp, stamp+1); System.out.println(c3); //false } }); refT1.start(); refT2.start(); } }
自旋CAS(不成功,就一直循環執行,直到成功)若是長時間不成功,會給CPU帶來很是大的執行開銷。若是JVM能支持處理器提供的pause指令那麼效率會有必定的提高,pause指令有兩個做用,第一它能夠延遲流水線執行指令(de-pipeline),使CPU不會消耗過多的執行資源,延遲的時間取決於具體實現的版本,在一些處理器上延遲時間是零。第二它能夠避免在退出循環的時候因內存順序衝突(memory order violation)而引發CPU流水線被清空(CPU pipeline flush),從而提升CPU的執行效率。
當對一個共享變量執行操做時,咱們可使用循環CAS的方式來保證原子操做,可是對多個共享變量操做時,循環CAS就沒法保證操做的原子性,這個時候就能夠用鎖,或者有一個取巧的辦法,就是把多個共享變量合併成一個共享變量來操做。好比有兩個共享變量i=2,j=a,合併一下ij=2a,而後用CAS來操做ij。從Java1.5開始JDK提供了AtomicReference類來保證引用對象之間的原子性,你能夠把多個變量放在一個對象裏來進行CAS操做。
一、對於資源競爭較少(線程衝突較輕)的狀況,使用synchronized同步鎖進行線程阻塞和喚醒切換以及用戶態內核態間的切換操做額外浪費消耗cpu資源;而CAS基於硬件實現,不須要進入內核,不須要切換線程,操做自旋概率較少,所以能夠得到更高的性能。
二、對於資源競爭嚴重(線程衝突嚴重)的狀況,CAS自旋的機率會比較大,從而浪費更多的CPU資源,效率低於synchronized。
補充:synchronized在jdk1.6以後,已經改進優化。synchronized的底層實現主要依靠Lock-Free的隊列,基本思路是自旋後阻塞,競爭切換後繼續競爭鎖,稍微犧牲了公平性,但得到了高吞吐量。在線程衝突較少的狀況下,能夠得到和CAS相似的性能;而線程衝突嚴重的狀況下,性能遠高於CAS。
因爲java的CAS同時具備 volatile 讀和volatile寫的內存語義,所以Java線程之間的通訊如今有了下面四種方式:
- A線程寫volatile變量,隨後B線程讀這個volatile變量。
- A線程寫volatile變量,隨後B線程用CAS更新這個volatile變量。
- A線程用CAS更新一個volatile變量,隨後B線程用CAS更新這個volatile變量。
- A線程用CAS更新一個volatile變量,隨後B線程讀這個volatile變量。
Java的CAS會使用現代處理器上提供的高效機器級別原子指令,這些原子指令以原子方式對內存執行讀-改-寫操做,這是在多處理器中實現同步的關鍵(從本質上來講,可以支持原子性讀-改-寫指令的計算機器,是順序計算圖靈機的異步等價機器,所以任何現代的多處理器都會去支持某種能對內存執行原子性讀-改-寫操做的原子指令)。同時,volatile變量的讀/寫和CAS能夠實現線程之間的通訊。把這些特性整合在一塊兒,就造成了整個concurrent包得以實現的基石。若是咱們仔細分析concurrent包的源代碼實現,會發現一個通用化的實現模式:
- 首先,聲明共享變量爲volatile;
- 而後,使用CAS的原子條件更新來實現線程之間的同步;
- 同時,配合以volatile的讀/寫和CAS所具備的volatile讀和寫的內存語義來實現線程之間的通訊。
AQS、非阻塞數據結構和原子變量類(java.util.concurrent.atomic包中的類),concurrent包中的基礎類都是使用這種模式來實現的。而concurrent包中的高層類又是依賴於這些基礎類來實現的。從總體來看,concurrent包的實現示意圖以下:
Java調用new object()會建立一個對象,這個對象會被分配到JVM的堆中。那麼這個對象究竟是怎麼在堆中保存的呢?
首先,new object()執行的時候,這個對象須要多大的空間,實際上是已經肯定的,由於java中的各類數據類型,佔用多大的空間都是固定的(對其原理不清楚的請自行Google)。那麼接下來的工做就是在堆中找出那麼一塊空間用於存放這個對象。
在單線程的狀況下,通常有兩種分配策略:
指針碰撞:這種通常適用於內存是絕對規整的(內存是否規整取決於內存回收策略),分配空間的工做只是將指針像空閒內存一側移動對象大小的距離便可。
空閒列表:這種適用於內存非規整的狀況,這種狀況下JVM會維護一個內存列表,記錄哪些內存區域是空閒的,大小是多少。給對象分配空間的時候去空閒列表裏查詢到合適的區域而後進行分配便可。
可是JVM不可能一直在單線程狀態下運行,那樣效率太差了。因爲再給一個對象分配內存的時候不是原子性的操做,至少須要如下幾步:查找空閒列表、分配內存、修改空閒列表等等,這是不安全的。解決併發時的安全問題也有兩種策略:
CAS:實際上虛擬機採用CAS配合上失敗重試的方式保證更新操做的原子性,原理和上面講的同樣。
TLAB:若是使用CAS其實對性能仍是會有影響的,因此JVM又提出了一種更高級的優化策略:每一個線程在Java堆中預先分配一小塊內存,稱爲本地線程分配緩衝區(TLAB),線程內部須要分配內存時直接在TLAB上分配就行,避免了線程衝突。只有當緩衝區的內存用光須要從新分配內存的時候纔會進行CAS操做分配更大的內存空間。
虛擬機是否使用TLAB,能夠經過-XX:+/-UseTLAB參數來進行配置(jdk5及之後的版本默認是啓用TLAB的)。
參考資料:
樂觀鎖的一種實現方式——CAS
Java併發問題--樂觀鎖與悲觀鎖以及樂觀鎖的一種實現方式-CAS
CAS原理 Java SE1.6中的Synchronized
JAVA併發編程: CAS和AQS
Java CAS 和ABA問題
CAS原理分析
慕課網高併發實戰(四)- 線程安全性
java Unsafe類中compareAndSwap相關介紹