volatile這個關鍵字可能不少朋友都據說過,或許也都用過。在Java 5以前,它是一個備受爭議的關鍵字,由於在程序中使用它每每會致使出人意料的結果。在Java 5以後,volatile關鍵字才得以重獲生機。java
volatile關鍵字雖然從字面上理解起來比較簡單,可是要用好不是一件容易的事情。因爲volatile關鍵字是與Java的內存模型有關的,所以在講述volatile關鍵以前,咱們先來了解一下與內存模型相關的概念和知識,而後分析了volatile關鍵字的實現原理,最後給出了幾個使用volatile關鍵字的場景。c++
你們都知道,計算機在執行程序時,每條指令都是在CPU中執行的,而執行指令過程當中,勢必涉及到數據的讀取和寫入。因爲程序運行過程當中的臨時數據是存放在主存
(物理內存)當中的,這時就存在一個問題,因爲CPU執行速度很快,而從內存讀取數據和向內存寫入數據的過程跟CPU執行指令的速度比起來要慢的多,所以若是任什麼時候候對數據的操做都要經過和內存的交互來進行,會大大下降指令執行的速度。所以在CPU裏面就有了高速緩存
。編程
也就是,當程序在運行過程當中,會將運算須要的數據從主存複製一份到CPU的高速緩存當中,那麼CPU進行計算時就能夠直接從它的高速緩存讀取數據和向其中寫入數據,當運算結束以後,再將高速緩存中的數據刷新到主存當中。舉個簡單的例子,好比下面的這段代碼:緩存
i = i + 1;
當線程執行這個語句時,會先從主存當中讀取i的值,而後複製一份到高速緩存當中,而後CPU執行指令對i進行加1操做,而後將數據寫入高速緩存,最後將高速緩存中i最新的值刷新到主存當中。多線程
這個代碼在單線程中運行是沒有任何問題的,可是在多線程中運行就會有問題了。在多核CPU中,每條線程可能運行於不一樣的CPU中,所以每一個線程運行時有本身的高速緩存(對單核CPU來講,其實也會出現這種問題,只不過是以線程調度的形式來分別執行的)。本文咱們以多核CPU爲例。併發
好比同時有2個線程執行這段代碼,假如初始時i的值爲0,那麼咱們但願兩個線程執行完以後i的值變爲2。可是可能存在下面一種狀況:初始時,兩個線程分別讀取i的值存入各自所在的CPU的高速緩存當中,而後線程1進行加1操做,而後把i的最新值1寫入到內存。此時線程2的高速緩存當中i的值仍是0,進行加1操做以後,i的值爲1,而後線程2把i的值寫入內存。app
最終結果i的值是1,而不是2。
這就是著名的緩存一致性問題
。一般稱這種被多個線程訪問的變量爲共享變量
。性能
也就是說,若是一個變量在多個CPU中都存在緩存(通常在多線程編程時纔會出現),那麼就可能存在緩存不一致的問題。優化
爲了解決緩存不一致性問題,一般來講有如下2種解決方法:atom
這2種方式都是硬件層面上提供的方式。
在早期的CPU當中,是經過在總線上加LOCK#鎖的形式來解決緩存不一致的問題。由於CPU和其餘部件進行通訊都是經過總線來進行的,若是對總線加LOCK#鎖的話,也就是說阻塞了其餘CPU對其餘部件訪問(如內存),從而使得只能有一個CPU能使用這個變量的內存。好比上面例子中 若是一個線程在執行 i = i +1,若是在執行這段代碼的過程當中,在總線上發出了LCOK#鎖的信號,那麼只有等待這段代碼徹底執行完畢以後,其餘CPU才能從變量i所在的內存讀取變量,而後進行相應的操做。這樣就解決了緩存不一致的問題。
很明顯,因爲在鎖住總線期間,其餘CPU沒法訪問內存,致使效率低下。
因此就出現了緩存一致性協議。
最出名的就是Intel的MESI協議,MESI
協議保證了每一個緩存中使用的共享變量的副本是一致的。它核心的思想是:當CPU寫數據時,若是發現操做的變量是共享變量,即在其餘CPU中也存在該變量的副本,會發出信號通知其餘CPU將該變量的緩存行置爲無效狀態,所以當其餘CPU須要讀取這個變量時,發現本身緩存中緩存該變量的緩存行是無效的,那麼它就會從內存從新讀取。
在併發編程中,咱們一般會遇到如下三個問題:
原子性問題,可見性問題,有序性問題
咱們先看具體看一下這三個概念:
即一個操做或者多個操做 要麼所有執行而且執行的過程不會被任何因素打斷,要麼就都不執行。
一個很經典的例子就是銀行帳戶轉帳問題:轉帳的2個操做必需要具有原子性才能保證不出現一些意外的問題。
可見性是指當多個線程訪問同一個變量時,一個線程修改了這個變量的值,其餘線程可以當即看獲得修改的值。
舉個簡單的例子,看下面這段代碼:
//線程1執行的代碼 int i = 0; i = 10; //線程2執行的代碼 j = i;
倘若執行線程1的是CPU1,執行線程2的是CPU2。由上面的分析可知,當線程1執行 i =10這句時,會先把i的初始值加載到CPU1的高速緩存中,而後賦值爲10,那麼在CPU1的高速緩存當中i的值變爲10了,卻沒有當即寫入到主存當中。
此時線程2執行 j = i,它會先去主存讀取i的值並加載到CPU2的緩存當中,注意此時內存當中i的值仍是0,那麼就會使得j的值爲0,而不是10.
這就是可見性問題,線程1對變量i修改了以後,線程2沒有當即看到線程1修改的值。
即程序執行的順序按照代碼的前後順序執行。舉個簡單的例子,看下面這段代碼:
int i = 0; boolean flag = false; i = 1; //語句1 flag = true; //語句2
上面代碼定義了一個int型變量,定義了一個boolean類型變量,而後分別對兩個變量進行賦值操做。從代碼順序上看,語句1是在語句2前面的,那麼JVM在真正執行這段代碼的時候會保證語句1必定會在語句2前面執行嗎?不必定,爲何呢?這裏可能會發生指令重排序
(Instruction Reorder)。
指令重排序
: 通常來講,處理器爲了提升程序運行效率,可能會對輸入代碼進行優化,它不保證程序中各個語句的執行前後順序同代碼中的順序一致,可是它會保證程序最終執行結果和代碼順序執行的結果是一致的。
好比上面的代碼中,語句1和語句2誰先執行對最終的程序結果並無影響,那麼就有可能在執行過程當中,語句2先執行而語句1後執行。
可是要注意,雖然處理器會對指令進行重排序,可是它會保證程序最終結果會和代碼順序執行結果相同,那麼它靠什麼保證的呢?再看下面一個例子:
int a = 10; //語句1 int r = 2; //語句2 a = a + 3; //語句3 r = a*a; //語句4
這段代碼有4個語句,那麼可能的一個執行順序是:
語句2 -> 語句1 -> 語句3 -> 語句4
那麼可不多是這個執行順序呢: 語句2 -> 語句1 -> 語句4 -> 語句3
不可能,由於處理器在進行重排序時是會考慮指令之間的數據依賴性,若是一個指令Instruction 2必須用到Instruction 1的結果,那麼處理器會保證Instruction 1會在Instruction 2以前執行。
上面其實就是單線程考慮的問題了,若是把指令重排序
放到多線程的狀況下來看沒有這麼簡單了。
下面看一個例子:
//線程1: context = loadContext(); //語句1 inited = true; //語句2 //線程2: while(!inited ){ sleep() } doSomethingwithconfig(context);
上面代碼中,因爲語句1和語句2沒有數據依賴性,所以可能會被重排序。
假如發生了重排序,在線程1執行過程當中先執行語句2,而此是線程2會覺得初始化工做已經完成,那麼就會跳出while循環,去執行doSomethingwithconfig(context)方法,而此時context並無被初始化,就會致使程序出錯。
從上面的分析中能夠看出,指令重排序不會影響單個線程的執行,可是會影響到線程併發執行的正確性。
也就是說,要想併發程序正確地執行,必需要保證原子性、可見性以及有序性。只要有一個沒有被保證,就有可能會致使程序運行不正確。
在前面談到了一些關於內存模型以及併發編程中可能會出現的一些問題。下面咱們來看一下Java是如何解決上面分析的三大併發問題的。Java爲了保證咱們在併發編程時保證程序的執行準確性,約定了Java內存模型
。
在Java虛擬機規範中試圖定義一種Java內存模型
(Java Memory Model,JMM)來屏蔽各個硬件平臺和操做系統的內存訪問差別,以實現讓Java程序在各類平臺下都能達到一致的內存訪問效果。
Java內存模型規定了哪些東西呢,它定義了程序中變量的訪問規則,往大一點說是定義了程序執行的次序。注意,爲了得到較好的執行性能,Java內存模型並無限制執行引擎使用處理器的寄存器或者高速緩存來提高指令執行速度,也沒有限制編譯器對指令進行重排序。也就是說,在java內存模型中,也會存在緩存一致性問題和指令重排序的問題。
Java內存模型
規定全部的變量都是存在主存當中(相似於前面說的物理內存),每一個線程都有本身的工做內存(相似於前面的高速緩存)。線程對變量的全部操做都必須在工做內存中進行,而不能直接對主存進行操做。而且每一個線程不能訪問其餘線程的工做內存。
舉個簡單的例子:在java中,執行下面這個語句:
i = 10;
執行線程必須先在本身的工做線程中對變量i所在的緩存行進行賦值操做,而後再寫入主存當中。而不是直接將數值10寫入主存當中。
那麼Java語言 自己對 原子性、可見性以及有序性提供了哪些保證呢?
在Java中,對基本數據類型的變量的讀取和賦值操做是原子性操做,即這些操做是不可被中斷的,要麼執行,要麼不執行。
請分析如下哪些操做是原子性操做:
x = 10; //語句1 y = x; //語句2 x++; //語句3 x = x + 1; //語句4
其實只有語句1是原子性操做,其餘三個語句都不是原子性操做。
語句1是直接將數值10賦值給x,也就是說線程執行這個語句的會直接將數值10寫入到工做內存中。
語句2實際上包含2個操做,它先要去讀取x的值,再將x的值寫入工做內存,雖然讀取x的值以及 將x的值寫入工做內存 這2個操做都是原子性操做,可是合起來就不是原子性操做了。
一樣的,x++和 x = x+1包括3個操做:讀取x的值,進行加1操做,寫入新的值。
也就是說,只有簡單的讀取、賦值(並且必須是將數字賦值給某個變量,變量之間的相互賦值不是原子操做)纔是原子操做。
從上面能夠看出,Java內存模型只保證了基本讀取和賦值是原子性操做,若是要實現更大範圍操做的原子性,能夠經過synchronized
和Lock
來實現。因爲synchronized和Lock可以保證任一時刻只有一個線程執行該代碼塊,那麼天然就不存在原子性問題了,從而保證了原子性。
對於可見性,Java提供了volatile
關鍵字來保證可見性。
當一個共享變量被volatile修飾時,它會保證修改的值會當即被更新到主存,當有其餘線程須要讀取時,它會去內存中讀取新值。
而普通的共享變量不能保證可見性,由於普通共享變量被修改以後,何時被寫入主存是不肯定的,當其餘線程去讀取時,此時內存中可能仍是原來的舊值,所以沒法保證可見性。
另外,經過synchronized
和Lock
也可以保證可見性,synchronized和Lock能保證同一時刻只有一個線程獲取鎖而後執行同步代碼,而且在釋放鎖以前會將對變量的修改刷新到主存當中。所以能夠保證可見性。
在Java內存模型中,容許編譯器和處理器對指令進行重排序,可是重排序過程不會影響到單線程程序的執行,卻會影響到多線程併發執行的正確性。
在Java裏面,能夠經過volatile關鍵字來保證必定的「有序性」。另外能夠經過synchronized和Lock來保證有序性,很顯然,synchronized和Lock保證每一個時刻是有一個線程執行同步代碼,至關因而讓線程順序執行同步代碼,天然就保證了有序性。
另外,Java內存模型具有一些先天的「有序性」,即不須要經過任何手段就可以獲得保證的有序性,這個一般也稱爲happens-before
原則在JVM中默默實現保證的。若是兩個操做的執行次序沒法從happens-before原則推導出來,那麼它們就不能保證它們的有序性,虛擬機能夠隨意地對它們進行重排序。
(具體happens-before原則請自行查詢)
一旦一個共享變量(類的成員變量、類的靜態成員變量)被volatile修飾以後,那麼就具有了兩層語義:
先看一段代碼,假如線程1先執行,線程2後執行:
//線程1 boolean stop = false; while(!stop){ doSomething(); } //線程2 stop = true;
這段代碼是很典型的一段代碼,不少人在中斷線程時可能都會採用這種標記辦法。可是事實上,這段代碼會徹底運行正確麼?不必定會將線程中斷。
在前面已經解釋過,每一個線程在運行過程當中都有本身的工做內存,那麼線程1在運行的時候,會將stop變量的值拷貝一份放在本身的工做內存當中。那麼當線程2更改了stop變量的值以後,可是還沒來得及寫入主存當中,線程2轉去作其餘事情了,那麼線程1因爲不知道線程2對stop變量的更改,所以還會一直循環下去。
可是用volatile修飾以後就變得不同了:
那麼在線程2修改stop值時(固然這裏包括2個操做,修改線程2工做內存中的值,而後將修改後的值寫入內存),會使得線程1的工做內存中緩存變量stop的緩存行無效,而後線程1讀取時,發現本身的緩存行無效,它會等待緩存行對應的主存地址被更新以後,而後去對應的主存讀取最新的值。
那麼線程1讀取到的就是最新的正確的值。
從上面知道volatile關鍵字保證了操做的可見性,可是volatile能保證對變量的操做是原子性嗎?
下面看一個例子:
public class Test { public volatile int inc = 0; public void increase() { inc++; } public static void main(String[] args) { final Test test = new Test(); for(int i=0;i<10;i++){ new Thread(){ public void run() { for(int j=0;j<1000;j++) test.increase(); }; }.start(); } while(Thread.activeCount()>1) //保證前面的線程都執行完 Thread.yield(); System.out.println(test.inc); } }
也許有些朋友認爲是10000。可是事實上運行它會發現每次運行結果都不一致,都是一個小於10000的數字。
或許有人會認爲上面是對變量inc進行自增操做,因爲volatile保證了可見性,那麼在每一個線程中對inc自增完以後,在其餘線程中都能看到修改後的值啊,因此有10個線程分別進行了1000次操做,那麼最終inc的值應該是1000*10=10000。
這裏面就有一個誤區了,volatile關鍵字能保證可見性沒有錯,可是上面的程序錯在沒能保證原子性。可見性只能保證每次讀取的是最新的值,可是volatile沒辦法保證對變量的操做的原子性。
在前面已經提到過,自增操做是不具有原子性的,它包括讀取變量的原始值、進行加1操做、寫入工做內存
。那麼就是說自增操做的三個子操做可能會分割開執行,就有可能致使下面這種狀況出現:
假如某個時刻變量inc的值爲10,
線程1對變量進行自增操做,線程1先讀取了變量inc的原始值,而後線程1被阻塞了;
而後線程2對變量進行自增操做,線程2也去讀取變量inc的原始值,因爲線程1只是對變量inc進行讀取操做,而沒有對變量進行修改操做,因此不會致使線程2的工做內存中緩存變量inc的緩存行無效,因此線程2會直接去主存讀取inc的值,發現inc的值時10,而後進行加1操做,並把11寫入工做內存,最後寫入主存。
而後線程1接着進行加1操做,因爲已經讀取了inc的值,注意此時在線程1的工做內存中inc的值仍然爲10,因此線程1對inc進行加1操做後inc的值爲11,而後將11寫入工做內存,最後寫入主存。
那麼兩個線程分別進行了一次自增操做後,inc只增長了1。
根源就在這裏,自增操做不是原子性操做,並且volatile也沒法保證對變量的任何操做都是原子性的。
把上面的代碼改爲如下任何一種均可以達到效果:
public class Test { public int inc = 0; public synchronized void increase() { inc++; } public static void main(String[] args) { final Test test = new Test(); for(int i=0;i<10;i++){ new Thread(){ public void run() { for(int j=0;j<1000;j++) test.increase(); }; }.start(); } while(Thread.activeCount()>1) //保證前面的線程都執行完 Thread.yield(); System.out.println(test.inc); } }
採用AtomicInteger:
public class Test { public AtomicInteger inc = new AtomicInteger(); public void increase() { inc.getAndIncrement(); } public static void main(String[] args) { final Test test = new Test(); for(int i=0;i<10;i++){ new Thread(){ public void run() { for(int j=0;j<1000;j++) test.increase(); }; }.start(); } while(Thread.activeCount()>1) //保證前面的線程都執行完 Thread.yield(); System.out.println(test.inc); } }
在java 1.5的java.util.concurrent.atomic包下提供了一些原子操做類,即對基本數據類型的 自增(加1操做),自減(減1操做)、以及加法操做(加一個數),減法操做(減一個數)進行了封裝,保證這些操做是原子性操做。atomic是利用CAS來實現原子性操做的(Compare And Swap),CAS其實是利用處理器提供的CMPXCHG指令實現的,而處理器執行CMPXCHG指令是一個原子性操做。
在前面提到volatile關鍵字能禁止指令重排序,因此volatile能在必定程度上保證有序性。
volatile關鍵字禁止指令重排序有兩層意思:
//x、y爲非volatile變量 //flag爲volatile變量 x = 2; //語句1 y = 0; //語句2 flag = true; //語句3 x = 4; //語句4 y = -1; //語句5
因爲flag變量爲volatile變量,那麼在進行指令重排序的過程的時候,不會將語句3放到語句一、語句2前面,也不會講語句3放到語句四、語句5後面。可是要注意語句1和語句2的順序、語句4和語句5的順序是不做任何保證的。
而且volatile關鍵字能保證,執行到語句3時,語句1和語句2一定是執行完畢了的,且語句1和語句2的執行結果對語句三、語句四、語句5是可見的。
那麼咱們回到前面舉的一個例子:
//線程1: context = loadContext(); //語句1 inited = true; //語句2 //線程2: while(!inited ){ sleep() } doSomethingwithconfig(context);
這裏若是用volatile關鍵字對inited變量進行修飾,就不會再出現問題了,由於當執行到語句2時,一定能保證context已經初始化完畢。
前面講述了源於volatile關鍵字的一些使用,下面咱們來探討一下volatile到底如何保證可見性和禁止指令重排序的。
你們要知道重排序分爲編譯器重排序和處理器重排序
。爲了實現 volatile 內存語義,JMM 會分別限制這兩種類型的重排序類型。下面是 JMM 針對編譯器制定的 volatile 重排序規則表:
是否能重排序 | 第二個操做 | ||
---|---|---|---|
第一個操做 | 普通讀 / 寫 | volatile 讀 | volatile 寫 |
普通讀 / 寫 | NO | ||
volatile 讀 | NO | NO | NO |
volatile 寫 | NO | NO |
舉例來講,第三行最後一個單元格的意思是:在程序順序中,當第一個操做爲普通變量的讀或寫時,若是第二個操做爲 volatile 寫,則編譯器不能重排序這兩個操做。
從上表咱們能夠看出:
下面這段話摘自《深刻理解Java虛擬機》:
觀察加入volatile關鍵字和沒有加入volatile關鍵字時所生成的彙編代碼發現,加入volatile關鍵字時,會多出一個lock前綴指令
lock前綴指令實際上至關於一個內存屏障
(也成內存柵欄),內存屏障會提供3個功能:
繼續往下看,這裏對內存屏障
對解釋:
爲了實現volatile
的內存語義,編譯器在生成字節碼時,會在指令序列中插入內存屏障來禁止特定類型的處理器重排序。JMM 把內存屏障指令分爲下列四類:
屏障類型 | 指令示例 | 說明 | |
---|---|---|---|
LoadLoad Barriers | Load1; LoadLoad; Load2 | 確保 Load1 數據的裝載,以前於 Load2 及全部後續裝載指令的裝載。 | |
StoreStore Barriers | Store1; StoreStore; Store2 | 確保 Store1 數據對其餘處理器可見(刷新到內存),以前於 Store2 及全部後續存儲指令的存儲。 | |
LoadStore Barriers | Load1; LoadStore; Store2 | 確保 Load1 數據裝載,以前於 Store2 及全部後續的存儲指令刷新到內存。 | |
StoreLoad Barriers | Store1; StoreLoad; Load2 | 確保 Store1 數據對其餘處理器變得可見(指刷新到內存),以前於 Load2 及全部後續裝載指令的裝載。StoreLoad Barriers 會使該屏障以前的全部內存訪問指令(存儲和裝載指令)完成以後,才執行該屏障以後的內存訪問指令。 |
StoreLoad Barriers
是一個「全能型」的屏障,它同時具備其餘三個屏障的效果。現代的多處理器大都支持該屏障(其餘類型的屏障不必定被全部處理器支持)。執行該屏障開銷會很昂貴,由於當前處理器一般要把寫緩衝區中的數據所有刷新到內存中(buffer fully flush)。
對於編譯器來講,發現一個最優佈置來最小化插入屏障的總數幾乎不可能,爲此,JMM 採起保守策略。下面是基於保守策略的 JMM 內存屏障插入策略:
上述內存屏障插入策略很是保守,但它能夠保證在任意處理器平臺,任意的程序中都能獲得正確的 volatile 內存語義。
下面是保守策略下,volatile 寫插入內存屏障後生成的指令序列示意圖:
上圖中的 StoreStore 屏障能夠保證在 volatile 寫以前,其前面的全部普通寫操做已經對任意處理器可見了。這是由於 StoreStore 屏障將保障上面全部的普通寫在 volatile 寫以前刷新到主內存。
下面是在保守策略下,volatile 讀插入內存屏障後生成的指令序列示意圖:
上圖中的 LoadLoad 屏障用來禁止處理器把上面的 volatile 讀與下面的普通讀重排序。LoadStore 屏障用來禁止處理器把上面的 volatile 讀與下面的普通寫重排序。
上面兩個例子中volatile寫
和volatile讀
的內存屏障插入策略很是保守。在實際執行時,只要不改變 volatile寫–讀
的內存語義,編譯器能夠根據具體狀況省略沒必要要的屏障(重複性的)。
synchronized關鍵字是防止多個線程同時執行一段代碼,那麼就會很影響程序執行效率,而volatile關鍵字在某些狀況下性能要優於synchronized,可是要注意volatile關鍵字是沒法替代synchronized關鍵字的,由於volatile關鍵字沒法保證操做的原子性。一般來講,使用volatile必須具有如下2個條件:
實際上,這些條件代表,能夠被寫入 volatile 變量的這些有效值獨立於任何程序的狀態,包括變量的當前狀態。
事實上,個人理解就是上面的2個條件須要保證操做是原子性操做,才能保證使用volatile關鍵字的程序在併發時可以正確執行。
下面列舉幾個Java中使用volatile的幾個場景。
volatile boolean flag = false; while(!flag){ doSomething(); } public void setFlag() { flag = true; } volatile boolean inited = false; //線程1: context = loadContext(); inited = true; //線程2: while(!inited ){ sleep() } doSomethingwithconfig(context);
class Singleton{ private volatile static Singleton instance = null; private Singleton() { } public static Singleton getInstance() { if(instance==null) { synchronized (Singleton.class) { if(instance==null) instance = new Singleton(); } } return instance; } }
參考資料:《Java編程思想》《深刻理解Java虛擬機》