volatile關鍵字解析

時間 2019-12-08

原文原文鏈接

一內存模型的相關概念

咱們知道，在計算機執行程序時，每條指令都是在CPU中執行的。而執行指令過程當中，勢必涉及到數據的讀取和寫入。因爲程序運行中的臨時數據時存放在主存(物理內存)當中的，這時就存在一個問題，因爲CPU執行速度很快，而從內存中讀取&寫入數據的速度很慢，所以對數據的操做若是經過內存的交互來操做，會大大下降指令執行的速度。所以在CPU中就有了高速緩存。html

也就是說，當程序在運行過程當中會講運算須要的數據從主存複製一份到CPU的高速緩存中，那麼CPU進行計算時就能夠直接從它的高速緩存和數據進行交互。當運算結束後，再將高速緩存中的數據刷新到主存當中，好比下面這段代碼:java

i = i + 1;

當線程執行這個語句時，會先從主存當中讀取i的值，而後複製一份到高速緩存當中，而後CPU執行指令對i進行加1操做，而後將數據寫入高速緩存，最後將高速緩存中i最新的值刷新到主存當中。編程

這個代碼在單線程中運行時沒有任何問題的，可是在多線程中運行就會有問題了。在多核CPU中，每條線程可能運行於不一樣的CPU中，所以每一個線程運行時有本身的高速緩存（對單核CPU來講，其實也會出現這種問題，只不過是以線程調度的形式來分別執行的）。下面咱們以多核CPU爲例緩存

好比同時有兩個線程執行這段代碼，假如初始值i的值爲0，那麼咱們但願兩個線程執行完以後的值變爲2，事實上必定會等於2嗎?多線程

考慮這樣一種case: 初始時，兩個線程分別讀取i的值存入各自所在的CPU的高速緩存中，而後線程1進行加1操做，而後把i的最新值1寫入到內存。此時線程2的高速緩存當中i的值仍是0，進行加1操做後，i的值爲1，而後線程2把i的值寫入內存。最終結果i的值是1而不是預期的2.這樣會出現緩存一致性的問題，一般稱這種被多個線程訪問的變量爲共享變量。也就是說，若是一個變量在多個CPU中都存在緩存（多線程下），那麼就可能存在緩存不一致的問題併發

爲了解決緩存不一致問題，一般來講有下面兩種解決辦法:app

1）經過在總線加LOCK#鎖的方式jvm

2）經過緩存一致性協議ide

這兩種都是硬件層面上提供的方式性能

在早期的CPU當中，是經過在總線上加LOCK#鎖的形式來解決緩存不一致的問題。由於CPU和其餘部件進行通訊是經過總線來進行的，若是對總線加LOCK#鎖的話，也就是阻塞了其餘CPU對其餘部件訪問(如內存)，從而使得只能有一個CPU能使用這個變量的內存。好比上面例子中"若是一個線程在執行i = i + 1", 若是在執行這段代碼的過程當中，在總線上發出了LOCK#鎖的信號，那麼只有等待這段代碼徹底執行完畢以後，其餘CPU才能從變量i所在的內存讀取變量，而後進行相應的操做。這樣就解決了緩存不一致的問題。

可是上面的方式也有一個問題，因爲在鎖住總線期間，其餘CPU沒法訪問內存，致使效率低下。因此就出現了緩存一致性協議。最出名的就是Intel的MESI協議，MESI協議保證了每一個緩存中使用的共享變量副本是一致的。他的核心思想是: 當CPU寫數據時，若是發現操做的變量時共享變量，即在其餘CPU中也存在該變量的副本，會發出信號通知其餘CPU將該變量的緩存行置爲無效狀態，所以當其餘CPU須要讀取這個變量時，發現本身緩存中緩存該變量的緩存行識是無效的，那麼它就會從內存從新讀取。

二併發編程中的三個概念

1 原子性

原子性即一個操做或多個操做要麼所有執行而且執行的過程不會被任何因素打斷，要麼就都不執行。

舉個簡單的例子，好比下面的爲一個32位的變量賦值過程不具有原子性的話，會發生什麼後果?

i = 9;

倘若一個線程執行到這個語句時，我暫且假設爲一個32位的變量賦值包括兩個過程: 爲低16位賦值，爲高16位賦值。那麼就可能出現這樣的狀況: 當將低16位數值寫入以後，忽然被中斷，而此時又有一個線程去讀取i的值，那麼讀取到的就是錯誤的數據。

2 可見性

可見性是指多個線程訪問同一個變量時，一個線程修改了這個變量的值，其餘線程可以當即看獲得修改的值

舉個簡單的例子:

//線程1執行的代碼
int i = 0;
i = 10;
 
//線程2執行的代碼
j = i;

假設執行線程1的是CPU1，執行線程2的是CPU2. 由上面的分析可知，當線程1執行 i = 10這條語句時，會先把i的初始值加載到CPU1的高速緩存中，而後賦值爲10，那麼在CPU1的高速緩存當中i的值變爲10了，卻沒有當即寫入到主存中。

此時線程2 執行 j = i, 它會先去主存讀取i的值並加載到CPU2的緩存當中，注意此時內存當中i的值仍是0，那麼就會使得j的值爲0，而不是10

這就是可見性問題，線程1對變量i修改了以後，線程2沒有當即看到線程1修改的值

3 有序性

即程序執行的順序按照代碼的前後順序執行。舉個簡單的例子，看下面這段代碼:

int i = 0;              
boolean flag = false;
i = 1;                //語句1  
flag = true;          //語句2

上面代碼定義了一個int型變量，定義了一個boolean類型變量，而後分別對兩個變量進行賦值操做。從代碼順序上看，語句1是在語句2前面的，那麼JVM在真正執行這段代碼的時候會保證語句1必定在語句2前面執行嗎？不必定，爲何呢？這裏可能會發生指令重排序(Instruction Reoder)

通常來講，處理器爲了提升程序運行效率，可能會對輸入代碼進行優化，它不保證程序中各個語句的執行前後順序一致，可是它會保證程序最終執行結果和代碼順序執行的結果是一致的。好比上面的代碼中，語句1和語句2誰先執行對最終的程序結果並無影響，那麼就可能在執行過程當中，語句2先執行而語句1後執行

雖然處理器會對指令進行重排序，可是它會保證程序最終結果會和代碼順序執行結果相同，靠的是維護一個happens-before的偏序關係，看下面一個例子:

int a = 10;    //語句1
int r = 2;    //語句2
a = a + 3;    //語句3
r = a*a;     //語句4

這段代碼有4個語句，那麼可能的一個執行順序是:

那麼多是這個執行順序呢: 語句2 --> 語句1 --> 語句4 --> 語句3

答案是否認的，由於處理器在進行重排序時會考慮指令間的數據依賴性，若是一個指令instruction2必須用到instruction1的結果(有偏序關係)，那麼處理器會保證執行順序。

雖然重排序不會影響單個線程內程序執行的結果，可是多線程呢？看下面一個例子:

//線程1:
context = loadContext();   //語句1
inited = true;             //語句2
 
//線程2:
while(!inited ){
  sleep()
}
doSomethingwithconfig(context);

上面代碼中，因爲語句1和語句2沒有數據依賴性，所以可能會被重排序。假如發生了重排序，在線程1執行過程當中先執行了語句2，而此時線程2會覺得初始化已經完成，那麼就會跳出while循環，執行doSomethingwithconfig(context)方法，而事實上context並無被初始化，就會致使程序出錯。

從上面能夠看出，指令重排序不會影響單個線程的執行，可是會影響到線程併發執行的正確性

也就是說，要想併發程序正確地執行，必需要保證原子性，可見性以及有序性。只有有一個沒有保證，就有可能致使程序運行不正確。

三 Java內存模型

接着下看一下java內存模型爲咱們提供了哪些保證以及在java中提供了哪些方法和機制讓咱們在進行多線程編程時可以保證程序執行的正確性。

在java虛擬機規範中試圖定義一種java內存模型來屏蔽各個硬件平臺和操做系統的內存訪問差別，以實現讓java程序在各個平臺下都能達到一致的內存訪問效果。那麼java內存模型規定了程序中變量的訪問規則，往大一點說是定義了程序執行的次序。注意，爲了得到較好的執行性能，java內存模型並無限制執行引擎使用處理器的寄存器或者高速緩存來提高指令執行速度，也沒有限制編譯器對指令進行重排序。也就是說，在java內存模型中，也會存在緩存一致性問題和指令重排序的問題。

java內存模型規定全部的變量都是存在主存當中(物理內存)，每一個線程都有本身的工做內存(高速緩存)。線程對變量的全部操做都必須在工做內存中進行，而不能直接對主存進行操做。而且每一個線程不能訪問其餘線程的工做內存。

那麼java語言自己對原子性，可見性以及有序性提供了哪些保證呢?

1 原子性

咱們先看下面幾個操做哪些操做是原子性的:

x = 10;         //語句1
y = x;         //語句2
x++;           //語句3
x = x + 1;     //語句4

答案是1.

語句1是直接將數值10賦值給x，也就是說線程執行這個語句的時候會直接將數值10寫入到工做內存中。

語句2實際上包含2個操做，它先要去讀取x的值，再將x的值寫入工做內存，雖然這兩個操做都是原子性操做，可是合起來就不是原子性操做了

語句3，4中都包括三個操做: 讀取x的值，進行加1操做，寫入新的值

也就是說，只有簡單的讀取，賦值(並且必須是將數字賦值給某個變量，變量之間的相互賦值不是原子操做)纔是原子操做

不過這裏有一點須要注意: 在32位平臺下，對64位數據的讀取和賦值是須要經過兩個操做來完成的，不能保證其原子性。不過最新的JDK中jvm已經保證對64位數據的讀取和賦值也是原子性操做了。

java內存模型只保證了基本讀取和賦值是原子性操做，若是要實現更大範圍操做的原子性，能夠經過synchronized和lock來實現。因爲鎖機制能夠保證任一時刻只有一個線程執行該代碼塊，那麼天然就不存在原子性問題了，從而保證了原子性。

2 可見性

對於可見性，java提供了volatile關鍵字來保證可見性。當一個共享變量被volatile修飾時，它會保證修改的值當即被更新到主存，當有其餘線程須要讀取時，它會去內存中讀取新值。而普通的共享變量不能保證可見性，由於普通共享變量被修改以後，何時被寫入主存是不肯定的，當其餘線程去讀取時，此時內存中可能仍是原來的舊值，所以沒法保證可見性。

另外，經過鎖機制（synchronized/lock）也可以保證可見性，由於保證了同一時刻只有一個線程獲取鎖而後執行同步代碼，而且在釋放鎖以前會把變量的修改刷新到主存中去，所以能夠保證可見性。

3 有序性

java能夠經過volatile關鍵字來保證必定的"有序性"。另外也能夠經過鎖機制來保證有序性，很顯然，鎖機制保證每一個時刻只有一個線程執行同步代碼，至關於時讓線程順序執行同步代碼，天然就保證了有序性。

另外，java內存模型具有一些先天的"有序性", 即不須要經過任何手段就可以保證有序性，這個一般稱爲happens-before原則。若是兩個操做的執行次序沒法從happens-before原則推導出來，那麼它們就不能保證有序性，虛擬機能夠隨意對它們進行排序。

下面就來具體介紹下happens-before原則（先行發生原則）：

程序次序規則：一個線程內，按照代碼順序，書寫在前面的操做先行發生於書寫在後面的操做
鎖定規則：一個unLock操做先行發生於後面對同一個鎖額lock操做
volatile變量規則：對一個變量的寫操做先行發生於後面對這個變量的讀操做
傳遞規則：若是操做A先行發生於操做B，而操做B又先行發生於操做C，則能夠得出操做A先行發生於操做C
線程啓動規則：Thread對象的start()方法先行發生於此線程的每一個一個動做
線程中斷規則：對線程interrupt()方法的調用先行發生於被中斷線程的代碼檢測到中斷事件的發生
線程終結規則：線程中全部的操做都先行發生於線程的終止檢測，咱們能夠經過Thread.join()方法結束、Thread.isAlive()的返回值手段檢測到線程已經終止執行
對象終結規則：一個對象的初始化完成先行發生於他的finalize()方法的開始

這8條原則摘自《深刻理解Java虛擬機》, 其中前4條規則是比較重要的，後4條規則都是顯而易見的。下面咱們來解釋一下前4條規則：

(1) 對於程序次序規則來講，個人理解就是一段程序代碼的執行在單個線程中看起來是有序的。注意，雖然這條規則中提到「書寫在前面的操做先行發生於書寫在後面的操做」，這個應該是程序看起來執行的順序是按照代碼順序執行的，由於虛擬機可能會對程序代碼進行指令重排序。雖然進行重排序，可是最終執行的結果是與程序順序執行的結果一致的，它只會對不存在數據依賴性的指令進行重排序。所以，在單個線程中，程序執行看起來是有序執行的，這一點要注意理解。事實上，這個規則是用來保證程序在單線程中執行結果的正確性，但沒法保證程序在多線程中執行的正確性。

(2) 第二條規則也比較容易理解，也就是說不管在單線程中仍是多線程中，同一個鎖若是出於被鎖定的狀態，那麼必須先對鎖進行了釋放操做，後面才能繼續進行lock操做。

(3) 第三條規則是一條比較重要的規則，也是後文將要重點講述的內容。直觀地解釋就是，若是一個線程先去寫一個變量，而後一個線程去進行讀取，那麼寫入操做確定會先行發生於讀操做。

(4) 第四條規則實際上就是體現happens-before原則具有傳遞性。

四深刻剖析volatile關鍵字

1 volatile關鍵字的兩層含義

一旦一個共享變量被volatile修飾以後，那麼就具有了兩層語義

(1) 保證了不一樣線程對這個變量進行操做的可見性，即一個線程修改了某個變量的值，新值對其餘線程來講是當即可見的

(2) 禁止進行指令重排序

先看一段代碼，假如線程1先執行，線程2後執行:

//線程1
boolean stop = false;
while(!stop){
    doSomething();
}
 
//線程2
stop = true;

這段代碼是很典型的一段代碼，不少人在中斷線程可能都會採用這種標記辦法。可是事實上，這段代碼會徹底運行正確麼？即必定會中斷線麼？不必定，也許在大多數時候，這個代碼可以把線程中斷,可是也有可能會致使沒法中斷線程（雖然可能性很小，可是隻要發生就會形成死循環）

咱們知道每一個線程在運行過程當中都有本身的工做內存，那麼線程1在運行的時候，會把stop的值拷貝一份放在本身的工做內存當中，那麼當線程2更改了stop變量的值以後，可是還沒來得及寫入主存當中，線程2轉去作其餘事情了，那麼線程1因爲不知道線程2對stop變量的更改，所以還會一直循環下去。

可是使用了volatile修飾以後就變得不同了:

　　第一：使用volatile關鍵字會強制將修改的值當即寫入主存；

　　第二：使用volatile關鍵字的話，當線程2進行修改時，會致使線程1的工做內存中緩存變量stop的緩存行無效（反映到硬件層的話，就是CPU的L1或者L2緩存中對應的緩存行無效）；

　　第三：因爲線程1的工做內存中緩存變量stop的緩存行無效，因此線程1再次讀取變量stop的值時會去主存讀取。

　　那麼在線程2修改stop值時（固然這裏包括2個操做，修改線程2工做內存中的值，而後將修改後的值寫入內存），會使得線程1的工做內存中緩存變量stop的緩存行無效，而後線程1讀取時，發現本身的緩存行無效，它會等待緩存行對應的主存地址被更新以後，而後去對應的主存讀取最新的值。

　　那麼線程1讀取到的就是最新的正確的值。

2 volatile保證原子性嗎？

咱們看一個例子:

public class Test {
    public volatile int inc = 0;
     
    public void increase() {
        inc++;
    }
     
    public static void main(String[] args) {
        final Test test = new Test();
        for(int i=0;i<10;i++){
            new Thread(){
                public void run() {
                    for(int j=0;j<1000;j++)
                        test.increase();
                };
            }.start();
        }
         
        while(Thread.activeCount()>1)  //保證前面的線程都執行完
            Thread.yield();
        System.out.println(test.inc);
    }
}

這段代碼的輸出結果是多少呢？可能咋一看以爲結果是10000，可是事實上運行會發現每次結果都不一致，都是一個小於10000的數字。

可能你會有疑問，不對呀，上面是對變量inc進行自增操做，因爲volatile保證了可見性，那麼在每一個線程中對inc自增完以後，在其餘線程中都能看到修改後的值啊，因此有10個線程分別進行了1000次操做，那麼最終inc的值應該是1000*10=10000。

這裏面就有一個誤區了，volatile關鍵字能保證可見性沒有錯，可是上面的程序錯在沒能保證原子性。可見性只能保證每次讀取的是最新的值，可是volatile沒辦法保證對變量的操做的原子性。在前面已經提到過，自增操做是不具有原子性的，它包括(a)讀取變量的原始值，(b)進行加1操做，(c)寫入工做內存。那麼就是說自增的三個子操做可能會分隔開執行，就會可能致使下面這種狀況:

假設某個時刻變量inc的值爲10，線程1，線程2同時要對inc作自增操做,

那麼參考上圖，若是線程1先讀取了變量值，而後線程1被阻塞了；而後CPU切換到線程2，線程2也去讀取變量inc的原始值，因爲線程1只是對變量inc進行讀取操做，而沒有對變量進行修改操做，因此不會致使線程2的工做內存中緩存變量inc的緩存行無效，因此線程2會直接去主存讀取inc的值，發現inc的值是10，而後進行加一操做，並把11寫入工做內存，最後寫入主存。

這時CPU從新切換給了線程1，線程1進行加1操做，因爲已經讀取了inc的值（不會再次去內存中讀)，注意此時在線程1的工做內存中inc的值仍然爲10，因此線程1對inc進行加1操做後inc的值爲11，而後將11寫入工做內存，最後寫入主存。

那麼兩個線程分別進行了一次自增操做後，inc只增長了1

把上面的代碼改爲如下任何一種均可以達到效果:

(1) 採用synchronized

public class Test {
    public  int inc = 0;
    
    public synchronized void increase() {
        inc++;
    }
    
    public static void main(String[] args) {
        final Test test = new Test();
        for(int i=0;i<10;i++){
            new Thread(){
                public void run() {
                    for(int j=0;j<1000;j++)
                        test.increase();
                };
            }.start();
        }
        
        while(Thread.activeCount()>1)  //保證前面的線程都執行完
            Thread.yield();
        System.out.println(test.inc);
    }
}

View Code

(2) 採用Lock

public class Test {
    public  int inc = 0;
    Lock lock = new ReentrantLock();
    
    public  void increase() {
        lock.lock();
        try {
            inc++;
        } finally{
            lock.unlock();
        }
    }
    
    public static void main(String[] args) {
        final Test test = new Test();
        for(int i=0;i<10;i++){
            new Thread(){
                public void run() {
                    for(int j=0;j<1000;j++)
                        test.increase();
                };
            }.start();
        }
        
        while(Thread.activeCount()>1)  //保證前面的線程都執行完
            Thread.yield();
        System.out.println(test.inc);
    }
}

View Code

(3) 採用AtomicInteger

public class Test {
    public  AtomicInteger inc = new AtomicInteger();
     
    public  void increase() {
        inc.getAndIncrement();
    }
    
    public static void main(String[] args) {
        final Test test = new Test();
        for(int i=0;i<10;i++){
            new Thread(){
                public void run() {
                    for(int j=0;j<1000;j++)
                        test.increase();
                };
            }.start();
        }
        
        while(Thread.activeCount()>1)  //保證前面的線程都執行完
            Thread.yield();
        System.out.println(test.inc);
    }
}

View Code

在java 1.5的java.util.concurrent.atomic包下提供了一些原子操做類，即對基本數據類型的自增（加1操做），自減（減1操做）、以及加法操做（加一個數），減法操做（減一個數）進行了封裝，保證這些操做是原子性操做。atomic是利用CAS來實現原子性操做的（Compare And Swap），CAS其實是利用處理器提供的CMPXCHG指令實現的，而處理器執行CMPXCHG指令是一個原子性操做。

3 volatile能保證有序性嗎？

在前面提到volatile關鍵字能禁止指令重排序，因此volatile能在必定程度上保證有序性

volatile關鍵字禁止指令重排序有兩層意思：

1）當程序執行到volatile變量的讀操做或者寫操做時，在其前面的操做的更改確定所有已經進行，且結果已經對後面的操做可見；在其後面的操做確定尚未進行；

2）在進行指令優化時，不能把volatile變量前面的語句放在其後面執行，也不能把volatile變量後面的語句放到其前面執行。

來看下面的例子:

//x、y爲非volatile變量
//flag爲volatile變量
 
x = 2;        //語句1
y = 0;        //語句2
flag = true;  //語句3
x = 4;         //語句4
y = -1;       //語句5

因爲flag變量爲volatile變量，那麼在進行指令重排序的過程的時候，不會將語句3放到語句1，2前面，也不會將語句3放到語句4，5後面。

可是要注意語句1和語句2的順序、語句4和語句5的順序是不做任何保證的。

而且volatile關鍵字能保證，執行到語句3時，語句1和語句2一定是執行完畢了的，且語句1和語句2的執行結果對語句三、語句四、語句5是可見的。

回到咱們最初的一個例子:

//線程1:
context = loadContext();   //語句1
inited = true;             //語句2
 
//線程2:
while(!inited ){
  sleep()
}
doSomethingwithconfig(context);

前面舉這個例子的時候，提到有可能語句2會在語句1以前執行，那麼久可能致使context還沒被初始化，而線程2中就使用未初始化的context去進行操做，致使程序出錯。

這裏若是用volatile關鍵字對inited變量進行修飾，就不會出現這種問題了，由於當執行到語句2時，一定能保證context已經初始化完畢。

4 volatile的原理和實現機制

下面這段話摘自《深刻理解Java虛擬機》：

「觀察加入volatile關鍵字和沒有加入volatile關鍵字時所生成的彙編代碼發現，加入volatile關鍵字時，會多出一個lock前綴指令」

lock前綴指令實際上至關於一個內存屏障（也成內存柵欄），內存屏障會提供3個功能：

1）它確保指令重排序時不會把其後面的指令排到內存屏障以前的位置，也不會把前面的指令排到內存屏障的後面；即在執行到內存屏障這句指令時，在它前面的操做已經所有完成；

2）它會強制將對緩存的修改操做當即寫入主存；

3）若是是寫操做，它會致使其餘CPU中對應的緩存行無效。

五使用volatile關鍵字的場景

　synchronized關鍵字是防止多個線程同時執行一段代碼，那麼就會很影響程序執行效率，而volatile關鍵字在某些狀況下性能要優於synchronized，可是要注意volatile關鍵字是沒法替代synchronized關鍵字的，由於volatile關鍵字沒法保證操做的原子性。一般來講，使用volatile必須具有如下2個條件：

　　1）對變量的寫操做不依賴於當前值

　　2）該變量沒有包含在具備其餘變量的不變式中

　　實際上，這些條件代表，能夠被寫入 volatile 變量的這些有效值獨立於任何程序的狀態，包括變量的當前狀態。

　　事實上，個人理解就是上面的2個條件須要保證操做是原子性操做，才能保證使用volatile關鍵字的程序在併發時可以正確執行。

　　下面列舉幾個Java中使用volatile的幾個場景

1 狀態標記量

volatile boolean flag = false;
 
while(!flag){
    doSomething();
}
 
public void setFlag() {
    flag = true;
}

volatile boolean inited = false;
//線程1:
context = loadContext();  
inited = true;            
 
//線程2:
while(!inited ){
sleep()
}
doSomethingwithconfig(context);

2.double check

class Singleton{
    private volatile static Singleton instance = null;
     
    private Singleton() {
         
    }
     
    public static Singleton getInstance() {
        if(instance==null) {
            synchronized (Singleton.class) {
                if(instance==null)
                    instance = new Singleton();
            }
        }
        return instance;
    }
}