你真的瞭解 volatile 關鍵字嗎?

volatile關鍵字常常在併發編程中使用,其特性是保證可見性以及有序性,可是關於volatile的使用仍然要當心,這須要明白volatile關鍵字的特性及實現的原理,這也是本篇文章的主要內容。html

1、Java內存模型

想要理解volatile爲何能確保可見性,就要先理解Java中的內存模型是什麼樣的。java

Java內存模型規定了全部的變量都存儲在主內存中每條線程中還有本身的工做內存,線程的工做內存中保存了被該線程所使用到的變量(這些變量是從主內存中拷貝而來)線程對變量的全部操做(讀取,賦值)都必須在工做內存中進行。不一樣線程之間也沒法直接訪問對方工做內存中的變量,線程間變量值的傳遞均須要經過主內存來完成c++

基於此種內存模型,便產生了多線程編程中的數據「髒讀」等問題。git

舉個簡單的例子:在java中,執行下面這個語句:編程

i  = 10;

執行線程必須先在本身的工做線程中對變量i所在的緩存行進行賦值操做,而後再寫入主存當中。而不是直接將數值10寫入主存當中。緩存

好比同時有2個線程執行這段代碼,假如初始時i的值爲10,那麼咱們但願兩個線程執行完以後i的值變爲12。可是事實會是這樣嗎?多線程

可能存在下面一種狀況:初始時,兩個線程分別讀取i的值存入各自所在的工做內存當中,而後線程1進行加1操做,而後把i的最新值11寫入到內存。此時線程2的工做內存當中i的值仍是10,進行加1操做以後,i的值爲11,而後線程2把i的值寫入內存。併發

最終結果i的值是11,而不是12。這就是著名的緩存一致性問題。一般稱這種被多個線程訪問的變量爲共享變量。app

那麼如何確保共享變量在多線程訪問時可以正確輸出結果呢?函數

在解決這個問題以前,咱們要先了解併發編程的三大概念:原子性,有序性,可見性

2、原子性

1.定義

原子性:即一個操做或者多個操做 要麼所有執行而且執行的過程不會被任何因素打斷,要麼就都不執行。

2.實例

一個很經典的例子就是銀行帳戶轉帳問題:

好比從帳戶A向帳戶B轉1000元,那麼必然包括2個操做:從帳戶A減去1000元,往帳戶B加上1000元。

試想一下,若是這2個操做不具有原子性,會形成什麼樣的後果。假如從帳戶A減去1000元以後,操做忽然停止。這樣就會致使帳戶A雖然減去了1000元,可是帳戶B沒有收到這個轉過來的1000元。

因此這2個操做必需要具有原子性才能保證不出現一些意外的問題。

一樣地反映到併發編程中會出現什麼結果呢?

舉個最簡單的例子,你們想一下假如爲一個32位的變量賦值過程不具有原子性的話,會發生什麼後果?

i = 9;

倘若一個線程執行到這個語句時,我暫且假設爲一個32位的變量賦值包括兩個過程:爲低16位賦值,爲高16位賦值。

那麼就可能發生一種狀況:當將低16位數值寫入以後,忽然被中斷,而此時又有一個線程去讀取i的值,那麼讀取到的就是錯誤的數據。

3.Java中的原子性

在Java中,對基本數據類型的變量的讀取和賦值操做是原子性操做,即這些操做是不可被中斷的,要麼執行,要麼不執行。

上面一句話雖然看起來簡單,可是理解起來並非那麼容易。看下面一個例子i:

請分析如下哪些操做是原子性操做:

x = 10;         //語句1
y = x;         //語句2
x++;           //語句3
x = x + 1;     //語句4

咋一看,可能會說上面的4個語句中的操做都是原子性操做。其實只有語句1是原子性操做,其餘三個語句都不是原子性操做。

語句1是直接將數值10賦值給x,也就是說線程執行這個語句的會直接將數值10寫入到工做內存中。

語句2實際上包含2個操做,它先要去讀取x的值,再將x的值寫入工做內存,雖然讀取x的值以及 將x的值寫入工做內存 這2個操做都是原子性操做,可是合起來就不是原子性操做了。

一樣的,x++和 x = x+1包括3個操做:讀取x的值,進行加1操做,寫入新的值

因此上面4個語句只有語句1的操做具有原子性。

也就是說,只有簡單的讀取、賦值(並且必須是將數字賦值給某個變量,變量之間的相互賦值不是原子操做)纔是原子操做。

從上面能夠看出,Java內存模型只保證了基本讀取和賦值是原子性操做,若是要實現更大範圍操做的原子性,能夠經過synchronized和Lock來實現。因爲synchronized和Lock可以保證任一時刻只有一個線程執行該代碼塊,那麼天然就不存在原子性問題了,從而保證了原子性。

關於synchronized和Lock的使用,參考:關於synchronized和ReentrantLock之多線程同步詳解

3、可見性

1.定義

可見性是指當多個線程訪問同一個變量時,一個線程修改了這個變量的值,其餘線程可以當即看獲得修改的值。

2.實例

舉個簡單的例子,看下面這段代碼:

//線程1執行的代碼
int i = 0;
i = 10;

//線程2執行的代碼
j = i;

由上面的分析可知,當線程1執行 i =10這句時,會先把i的初始值加載到工做內存中,而後賦值爲10,那麼在線程1的工做內存當中i的值變爲10了,卻沒有當即寫入到主存當中。

此時線程2執行 j = i,它會先去主存讀取i的值並加載到線程2的工做內存當中,注意此時內存當中i的值仍是0,那麼就會使得j的值爲0,而不是10.

這就是可見性問題,線程1對變量i修改了以後,線程2沒有當即看到線程1修改的值。

3.Java中的可見性

對於可見性,Java提供了volatile關鍵字來保證可見性。

當一個共享變量被volatile修飾時,它會保證修改的值會當即被更新到主存,當有其餘線程須要讀取時,它會去內存中讀取新值。

而普通的共享變量不能保證可見性,由於普通共享變量被修改以後,何時被寫入主存是不肯定的,當其餘線程去讀取時,此時內存中可能仍是原來的舊值,所以沒法保證可見性。

另外,經過synchronized和Lock也可以保證可見性,synchronized和Lock能保證同一時刻只有一個線程獲取鎖而後執行同步代碼,而且在釋放鎖以前會將對變量的修改刷新到主存當中。所以能夠保證可見性。

4、有序性

1.定義

有序性:即程序執行的順序按照代碼的前後順序執行。

2.實例

舉個簡單的例子,看下面這段代碼:

int i = 0;              

boolean flag = false;

i = 1;                //語句1  
flag = true;          //語句2

上面代碼定義了一個int型變量,定義了一個boolean類型變量,而後分別對兩個變量進行賦值操做。從代碼順序上看,語句1是在語句2前面的,那麼JVM在真正執行這段代碼的時候會保證語句1必定會在語句2前面執行嗎?不必定,爲何呢?這裏可能會發生指令重排序(Instruction Reorder)。

下面解釋一下什麼是指令重排序,通常來講,處理器爲了提升程序運行效率,可能會對輸入代碼進行優化,它不保證程序中各個語句的執行前後順序同代碼中的順序一致,可是它會保證程序最終執行結果和代碼順序執行的結果是一致的。

好比上面的代碼中,語句1和語句2誰先執行對最終的程序結果並無影響,那麼就有可能在執行過程當中,語句2先執行而語句1後執行。

可是要注意,雖然處理器會對指令進行重排序,可是它會保證程序最終結果會和代碼順序執行結果相同,那麼它靠什麼保證的呢?再看下面一個例子:

int a = 10;    //語句1
int r = 2;    //語句2
a = a + 3;    //語句3
r = a*a;     //語句4

這段代碼有4個語句,那麼可能的一個執行順序是:
  


  
那麼可不多是這個執行順序呢: 語句2 語句1 語句4 語句3

不可能,由於處理器在進行重排序時是會考慮指令之間的數據依賴性,若是一個指令Instruction 2必須用到Instruction 1的結果,那麼處理器會保證Instruction 1會在Instruction 2以前執行。

雖然重排序不會影響單個線程內程序執行的結果,可是多線程呢?下面看一個例子:

//線程1:

context = loadContext();   //語句1
inited = true;             //語句2

 //線程2:
while(!inited ){
   sleep()
}
doSomethingwithconfig(context);

上面代碼中,因爲語句1和語句2沒有數據依賴性,所以可能會被重排序。假如發生了重排序,在線程1執行過程當中先執行語句2,而此是線程2會覺得初始化工做已經完成,那麼就會跳出while循環,去執行doSomethingwithconfig(context)方法,而此時context並無被初始化,就會致使程序出錯。

從上面能夠看出,指令重排序不會影響單個線程的執行,可是會影響到線程併發執行的正確性。

也就是說,要想併發程序正確地執行,必需要保證原子性、可見性以及有序性。只要有一個沒有被保證,就有可能會致使程序運行不正確。

3.Java中的有序性

在Java內存模型中,容許編譯器和處理器對指令進行重排序,可是重排序過程不會影響到單線程程序的執行,卻會影響到多線程併發執行的正確性。

在Java裏面,能夠經過volatile關鍵字來保證必定的「有序性」。另外能夠經過synchronized和Lock來保證有序性,很顯然,synchronized和Lock保證每一個時刻是有一個線程執行同步代碼,至關因而讓線程順序執行同步代碼,天然就保證了有序性。

另外,Java內存模型具有一些先天的「有序性」,即不須要經過任何手段就可以獲得保證的有序性,這個一般也稱爲 happens-before 原則。若是兩個操做的執行次序沒法從happens-before原則推導出來,那麼它們就不能保證它們的有序性,虛擬機能夠隨意地對它們進行重排序。

下面就來具體介紹下happens-before原則(先行發生原則):

①程序次序規則:一個線程內,按照代碼順序,書寫在前面的操做先行發生於書寫在後面的操做

②鎖定規則:一個unLock操做先行發生於後面對同一個鎖額lock操做

③volatile變量規則:對一個變量的寫操做先行發生於後面對這個變量的讀操做

④傳遞規則:若是操做A先行發生於操做B,而操做B又先行發生於操做C,則能夠得出操做A先行發生於操做C

⑤線程啓動規則:Thread對象的start()方法先行發生於此線程的每一個一個動做

⑥線程中斷規則:對線程interrupt()方法的調用先行發生於被中斷線程的代碼檢測到中斷事件的發生

⑦線程終結規則:線程中全部的操做都先行發生於線程的終止檢測,咱們能夠經過Thread.join()方法結束、Thread.isAlive()的返回值手段檢測到線程已經終止執行

⑧對象終結規則:一個對象的初始化完成先行發生於他的finalize()方法的開始
 
這8條規則中,前4條規則是比較重要的,後4條規則都是顯而易見的。

下面咱們來解釋一下前4條規則:

對於程序次序規則來講,就是一段程序代碼的執行在單個線程中看起來是有序的。注意,雖然這條規則中提到「書寫在前面的操做先行發生於書寫在後面的操做」,這個應該是程序看起來執行的順序是按照代碼順序執行的,可是虛擬機可能會對程序代碼進行指令重排序。雖然進行重排序,可是最終執行的結果是與程序順序執行的結果一致的,它只會對不存在數據依賴性的指令進行重排序。所以,在單個線程中,程序執行看起來是有序執行的,這一點要注意理解。事實上,這個規則是用來保證程序在單線程中執行結果的正確性,但沒法保證程序在多線程中執行的正確性。

第二條規則也比較容易理解,也就是說不管在單線程中仍是多線程中,同一個鎖若是處於被鎖定的狀態,那麼必須先對鎖進行了釋放操做,後面才能繼續進行lock操做。

第三條規則是一條比較重要的規則。直觀地解釋就是,若是一個線程先去寫一個變量,而後一個線程去進行讀取,那麼寫入操做確定會先行發生於讀操做。

第四條規則實際上就是體現happens-before原則具有傳遞性

5、深刻理解volatile關鍵字

1.volatile保證可見性

一旦一個共享變量(類的成員變量、類的靜態成員變量)被volatile修飾以後,那麼就具有了兩層語義:

1)保證了不一樣線程對這個變量進行操做時的可見性,即一個線程修改了某個變量的值,這新值對其餘線程來講是當即可見的。

2)禁止進行指令重排序。

先看一段代碼,假如線程1先執行,線程2後執行:

//線程1
boolean stop = false;
while(!stop){
    doSomething();
}

//線程2
stop = true;

這段代碼是很典型的一段代碼,不少人在中斷線程時可能都會採用這種標記辦法。可是事實上,這段代碼會徹底運行正確麼?即必定會將線程中斷麼?不必定,也許在大多數時候,這個代碼可以把線程中斷,可是也有可能會致使沒法中斷線程(雖然這個可能性很小,可是隻要一旦發生這種狀況就會形成死循環了)。

下面解釋一下這段代碼爲什麼有可能致使沒法中斷線程。在前面已經解釋過,每一個線程在運行過程當中都有本身的工做內存,那麼線程1在運行的時候,會將stop變量的值拷貝一份放在本身的工做內存當中。

那麼當線程2更改了stop變量的值以後,可是還沒來得及寫入主存當中,線程2轉去作其餘事情了,那麼線程1因爲不知道線程2對stop變量的更改,所以還會一直循環下去。

可是用volatile修飾以後就變得不同了:

第一:使用volatile關鍵字會強制將修改的值當即寫入主存

第二:使用volatile關鍵字的話,當線程2進行修改時,會致使線程1的工做內存中緩存變量stop的緩存行無效(反映到硬件層的話,就是CPU的L1或者L2緩存中對應的緩存行無效);

第三:因爲線程1的工做內存中緩存變量stop的緩存行無效,因此線程1再次讀取變量stop的值時會去主存讀取

那麼在線程2修改stop值時(固然這裏包括2個操做,修改線程2工做內存中的值,而後將修改後的值寫入內存),會使得線程1的工做內存中緩存變量stop的緩存行無效,而後線程1讀取時,發現本身的緩存行無效,它會等待緩存行對應的主存地址被更新以後,而後去對應的主存讀取最新的值。

那麼線程1讀取到的就是最新的正確的值。

2.volatile不能確保原子性

下面看一個例子:

public class Test {
    public volatile int inc = 0;

    public void increase() {
        inc++;
    }

    public static void main(String[] args) {
        final Test test = new Test();
        for(int i=0;i<10;i++){
            new Thread(){
                public void run() {
                    for(int j=0;j<1000;j++)
                        test.increase();
                };
            }.start();
        }

        while(Thread.activeCount()>1)  //保證前面的線程都執行完
            Thread.yield();
        System.out.println(test.inc);
    }
}

你們想一下這段程序的輸出結果是多少?也許有些朋友認爲是10000。可是事實上運行它會發現每次運行結果都不一致,都是一個小於10000的數字。

可能有的朋友就會有疑問,不對啊,上面是對變量inc進行自增操做,因爲volatile保證了可見性,那麼在每一個線程中對inc自增完以後,在其餘線程中都能看到修改後的值啊,因此有10個線程分別進行了1000次操做,那麼最終inc的值應該是1000*10=10000。

這裏面就有一個誤區了,volatile關鍵字能保證可見性沒有錯,可是上面的程序錯在沒能保證原子性。可見性只能保證每次讀取的是最新的值,可是volatile沒辦法保證對變量的操做的原子性。

在前面已經提到過,自增操做是不具有原子性的,它包括讀取變量的原始值、進行加1操做、寫入工做內存。那麼就是說自增操做的三個子操做可能會分割開執行,就有可能致使下面這種狀況出現:

假如某個時刻變量inc的值爲10,

線程1對變量進行自增操做,線程1先讀取了變量inc的原始值,而後線程1被阻塞了

而後線程2對變量進行自增操做,線程2也去讀取變量inc的原始值,因爲線程1只是對變量inc進行讀取操做,而沒有對變量進行修改操做,因此不會致使線程2的工做內存中緩存變量inc的緩存行無效,也不會致使主存中的值刷新,因此線程2會直接去主存讀取inc的值,發現inc的值時10,而後進行加1操做,並把11寫入工做內存,最後寫入主存。

而後線程1接着進行加1操做,因爲已經讀取了inc的值,注意此時在線程1的工做內存中inc的值仍然爲10,因此線程1對inc進行加1操做後inc的值爲11,而後將11寫入工做內存,最後寫入主存。

那麼兩個線程分別進行了一次自增操做後,inc只增長了1。

根源就在這裏,自增操做不是原子性操做,並且volatile也沒法保證對變量的任何操做都是原子性的。

解決方案:能夠經過synchronized或lock,進行加鎖,來保證操做的原子性。也能夠經過AtomicInteger。

在java 1.5的java.util.concurrent.atomic包下提供了一些原子操做類,即對基本數據類型的 自增(加1操做),自減(減1操做)、以及加法操做(加一個數),減法操做(減一個數)進行了封裝,保證這些操做是原子性操做。atomic是利用CAS來實現原子性操做的(Compare And Swap),CAS其實是利用處理器提供的CMPXCHG指令實現的,而處理器執行CMPXCHG指令是一個原子性操做。

3.volatile保證有序性

在前面提到volatile關鍵字能禁止指令重排序,因此volatile能在必定程度上保證有序性。

volatile關鍵字禁止指令重排序有兩層意思:

1)當程序執行到volatile變量的讀操做或者寫操做時,在其前面的操做的更改確定所有已經進行,且結果已經對後面的操做可見;在其後面的操做確定尚未進行

2)在進行指令優化時,不能將在對volatile變量的讀操做或者寫操做的語句放在其後面執行,也不能把volatile變量後面的語句放到其前面執行。

可能上面說的比較繞,舉個簡單的例子:

//x、y爲非volatile變量
//flag爲volatile變量

x = 2;        //語句1
y = 0;        //語句2
flag = true;  //語句3
x = 4;         //語句4
y = -1;       //語句5

因爲flag變量爲volatile變量,那麼在進行指令重排序的過程的時候,不會將語句3放到語句一、語句2前面,也不會講語句3放到語句四、語句5後面。可是要注意語句1和語句2的順序、語句4和語句5的順序是不做任何保證的。

而且volatile關鍵字能保證,執行到語句3時,語句1和語句2一定是執行完畢了的,且語句1和語句2的執行結果對語句三、語句四、語句5是可見的。

那麼咱們回到前面舉的一個例子:

//線程1:
context = loadContext();   //語句1
inited = true;             //語句2

//線程2:
while(!inited ){
  sleep()
}
doSomethingwithconfig(context);

前面舉這個例子的時候,提到有可能語句2會在語句1以前執行,那麼久可能致使context還沒被初始化,而線程2中就使用未初始化的context去進行操做,致使程序出錯。

這裏若是用volatile關鍵字對inited變量進行修飾,就不會出現這種問題了,由於當執行到語句2時,一定能保證context已經初始化完畢。

6、volatile的實現原理

1.可見性

處理器爲了提升處理速度,不直接和內存進行通信,而是將系統內存的數據獨到內部緩存後再進行操做,但操做完後不知何時會寫到內存。

若是對聲明瞭volatile變量進行寫操做時,JVM會向處理器發送一條Lock前綴的指令,將這個變量所在緩存行的數據寫會到系統內存。 這一步確保了若是有其餘線程對聲明瞭volatile變量進行修改,則當即更新主內存中數據。

但這時候其餘處理器的緩存仍是舊的,因此在多處理器環境下,爲了保證各個處理器緩存一致,每一個處理會經過嗅探在總線上傳播的數據來檢查 本身的緩存是否過時,當處理器發現本身緩存行對應的內存地址被修改了,就會將當前處理器的緩存行設置成無效狀態,當處理器要對這個數據進行修改操做時,會強制從新從系統內存把數據讀處處理器緩存裏。 這一步確保了其餘線程得到的聲明瞭volatile變量都是從主內存中獲取最新的。

2.有序性

Lock前綴指令實際上至關於一個內存屏障(也成內存柵欄),它確保指令重排序時不會把其後面的指令排到內存屏障以前的位置,也不會把前面的指令排到內存屏障的後面;即在執行到內存屏障這句指令時,在它前面的操做已經所有完成。

7、volatile的應用場景

synchronized關鍵字是防止多個線程同時執行一段代碼,那麼就會很影響程序執行效率,而volatile關鍵字在某些狀況下性能要優於synchronized,可是要注意volatile關鍵字是沒法替代synchronized關鍵字的,由於volatile關鍵字沒法保證操做的原子性。一般來講,使用volatile必須具有如下2個條件:

1)對變量的寫操做不依賴於當前值

2)該變量沒有包含在具備其餘變量的不變式中

下面列舉幾個Java中使用volatile的幾個場景。

①.狀態標記量

volatile boolean flag = false;
 //線程1
while(!flag){
    doSomething();
}
  //線程2
public void setFlag() {
    flag = true;
}

根據狀態標記,終止線程。

②.單例模式中的double check

class Singleton{
    private volatile static Singleton instance = null;

    private Singleton() {

    }

    public static Singleton getInstance() {
        if(instance==null) {
            synchronized (Singleton.class) {
                if(instance==null)
                    instance = new Singleton();
            }
        }
        return instance;
    }
}

爲何要使用volatile 修飾instance?

主要在於instance = new Singleton()這句,這並不是是一個原子操做,事實上在 JVM 中這句話大概作了下面 3 件事情:

1.給 instance 分配內存

2.調用 Singleton 的構造函數來初始化成員變量

3.將instance對象指向分配的內存空間(執行完這步 instance 就爲非 null 了)。

可是在 JVM 的即時編譯器中存在指令重排序的優化。也就是說上面的第二步和第三步的順序是不能保證的,最終的執行順序多是 1-2-3 也多是 1-3-2。若是是後者,則在 3 執行完畢、2 未執行以前,被線程二搶佔了,這時 instance 已是非 null 了(但卻沒有初始化),因此線程二會直接返回 instance,而後使用,而後瓜熟蒂落地報錯。

參考文章

Java併發編程:volatile關鍵字解析
【死磕Java併發】-----深刻分析volatile的實現原理
Java併發機制的底層實現原理
Volatile的實現原理

相關文章
相關標籤/搜索