Volatile之Java內存模型概念

時間 2019-11-29

原文原文鏈接

本文主要講解Java內存模型和併發的基礎概念，目的是爲下文「volatile實踐」一文作鋪墊。java

1.內存模型相關概念

你們都知道，計算機在執行程序時，每條指令都是在CPU中執行的，而執行指令過程當中，勢必涉及到數據的讀取和寫入。因爲程序運行過程當中的臨時數據是存放在主存（物理內存）當中的，這時就存在一個問題，因爲CPU執行速度很快，而從內存讀取數據和向內存寫入數據的過程跟CPU執行指令的速度比起來要慢的多，所以若是任什麼時候候對數據的操做都要經過和內存的交互來進行，會大大下降指令執行的速度。所以在CPU裏面就有了高速緩存。
也就是，當程序在運行過程當中，會將運算須要的數據從主存複製一份到CPU的高速緩存當中，那麼CPU進行計算時就能夠直接從它的高速緩存讀取數據和向其中寫入數據，當運算結束以後，再將高速緩存中的數據刷新到主存當中。舉個簡單的例子，好比下面的這段代碼：編程

i = i + 1;
複製代碼

當線程執行這個語句時，會先從主存當中讀取i的值，而後複製一份到高速緩存當中，而後CPU執行指令對i進行加1操做，而後將數據寫入高速緩存，最後將高速緩存中i最新的值刷新到主存當中。
這個代碼在單線程中運行是沒有任何問題的，可是在多線程中運行就會有問題了。在多核CPU中，每條線程可能運行於不一樣的CPU中，所以每一個線程運行時有本身的高速緩存（對單核CPU來講，其實也會出現這種問題，只不過是以線程調度的形式來分別執行的）。本文咱們以多核CPU爲例
好比同時有2個線程執行這段代碼，假如初始時i的值爲0，那麼咱們但願兩個線程執行完以後i的值變爲2。可是事實會是這樣嗎？
可能存在下面一種狀況：初始時，兩個線程分別讀取i的值存入各自所在的CPU的高速緩存當中，而後線程1進行加1操做，而後把i的最新值1寫入到內存。此時線程2的高速緩存當中i的值仍是0，進行加1操做以後，i的值爲1，而後線程2把i的值寫入內存。
最終結果i的值是1，而不是2。這就是著名的緩存一致性問題。一般稱這種被多個線程訪問的變量爲共享變量。
也就是說，若是一個變量在多個CPU中都存在緩存（通常在多線程編程時纔會出現），那麼就可能存在緩存不一致的問題。
爲了解決緩存不一致性問題，一般來講有如下2種解決方法：
1）經過在總線加LOCK#鎖的方式
2）經過緩存一致性協議
這2種方式都是硬件層面上提供的方式。
在早期的CPU當中，是經過在總線上加LOCK#鎖的形式來解決緩存不一致的問題。由於CPU和其餘部件進行通訊都是經過總線來進行的，若是對總線加LOCK#鎖的話，也就是說阻塞了其餘CPU對其餘部件訪問（如內存），從而使得只能有一個CPU能使用這個變量的內存。好比上面例子中若是一個線程在執行 i = i +1，若是在執行這段代碼的過程當中，在總線上發出了LCOK#鎖的信號，那麼只有等待這段代碼徹底執行完畢以後，其餘CPU才能從變量i所在的內存讀取變量，而後進行相應的操做。這樣就解決了緩存不一致的問題。
可是上面的方式會有一個問題，因爲在鎖住總線期間，其餘CPU沒法訪問內存，致使效率低下。因此就出現了緩存一致性協議。最出名的就是Intel 的MESI協議，MESI協議保證了每一個緩存中使用的共享變量的副本是一致的。它核心的思想是：當CPU寫數據時，若是發現操做的變量是共享變量，即在其餘CPU中也存在該變量的副本，會發出信號通知其餘CPU將該變量的緩存行置爲無效狀態，所以當其餘CPU須要讀取這個變量時，發現本身緩存中緩存該變量的緩存行是無效的，那麼它就會從內存從新讀取。緩存

2.併發編程中的三個概念

在併發編程中，咱們一般會遇到如下三個問題：原子性問題，可見性問題，有序性問題。咱們先看具體看一下這三個概念：bash

2.1 原子性

原子性：即一個操做或者多個操做要麼所有執行而且執行的過程不會被任何因素打斷，要麼就都不執行。
一個很經典的例子就是銀行帳戶轉帳問題：
好比從帳戶A向帳戶B轉1000元，那麼必然包括2個操做：從帳戶A減去1000元，往帳戶B加上1000元。
試想一下，若是這2個操做不具有原子性，會形成什麼樣的後果。假如從帳戶A減去1000元以後，操做忽然停止。而後又從B取出了500元，取出500元以後，再執行往帳戶B加上1000元的操做。這樣就會致使帳戶A雖然減去了1000元，可是帳戶B沒有收到這個轉過來的1000元。
因此這2個操做必需要具有原子性才能保證不出現一些意外的問題。
一樣地反映到併發編程中會出現什麼結果呢？
舉個最簡單的例子，你們想一下假如爲一個32位的變量賦值過程不具有原子性的話，會發生什麼後果？多線程

i = 9
複製代碼

倘若一個線程執行到這個語句時，我暫且假設爲一個32位的變量賦值包括兩個過程：爲低16位賦值，爲高16位賦值。
那麼就可能發生一種狀況：當將低16位數值寫入以後，忽然被中斷，而此時又有一個線程去讀取i的值，那麼讀取到的就是錯誤的數據。併發

2.2 可見性

可見性是指當多個線程訪問同一個變量時，一個線程修改了這個變量的值，其餘線程可以當即看獲得修改的值。
舉個簡單的例子，看下面這段代碼app

//線程1執行的代碼
int i = 0;
i = 10;
//線程2執行的代碼
j = i;
複製代碼

倘若執行線程1的是CPU1，執行線程2的是CPU2。由上面的分析可知，當線程1執行 i =10這句時，會先把i的初始值加載到CPU1的高速緩存中，而後賦值爲10，那麼在CPU1的高速緩存當中i的值變爲10了，卻沒有當即寫入到主存當中。
此時線程2執行 j = i，它會先去主存讀取i的值並加載到CPU2的緩存當中，注意此時內存當中i的值仍是0，那麼就會使得j的值爲0，而不是10.
這就是可見性問題，線程1對變量i修改了以後，線程2沒有當即看到線程1修改的值。性能

2.3 有序性

有序性：即程序執行的順序按照代碼的前後順序執行。舉個簡單的例子，看下面這段代碼：優化

int i = 0;               
boolean flag = false;
i = 1;                //語句1   
flag = true;          //語句2
複製代碼

上面代碼定義了一個int型變量，定義了一個boolean類型變量，而後分別對兩個變量進行賦值操做。從代碼順序上看，語句1是在語句2前面的，那麼JVM在真正執行這段代碼的時候會保證語句1必定會在語句2前面執行嗎？不必定，爲何呢？這裏可能會發生指令重排序（Instruction Reorder）。
下面解釋一下什麼是指令重排序，通常來講，處理器爲了提升程序運行效率，可能會對輸入代碼進行優化，它不保證程序中各個語句的執行前後順序同代碼中的順序一致，可是它會保證程序最終執行結果和代碼順序執行的結果是一致的。好比上面的代碼中，語句1和語句2誰先執行對最終的程序結果並無影響，那麼就有可能在執行過程當中，語句2先執行而語句1後執行。
可是要注意，雖然處理器會對指令進行重排序，可是它會保證程序最終結果會和代碼順序執行結果相同，那麼它靠什麼保證的呢？再看下面一個例子：spa

int a = 10;    //語句1
int r = 2;    //語句2
a = a + 3;    //語句3
r = a*a;     //語句4
複製代碼

這段代碼有4個語句，那麼可能的一個執行順序是：

那麼可不多是這個執行順序呢：語句2 語句1 語句4 語句3
不可能，由於處理器在進行重排序時是會考慮指令之間的數據依賴性，若是一個指令Instruction 2必須用到 Instruction 1的結果，那麼處理器會保證Instruction 1會在Instruction 2以前執行。
雖然重排序不會影響單個線程內程序執行的結果，可是多線程呢？下面看一個例子：

//線程1:
context = loadContext();   //語句1
inited = true;             //語句2
 
//線程2:
while(!inited ){
  sleep() 
}
doSomethingwithconfig(context);
複製代碼

上面代碼中，因爲語句1和語句2沒有數據依賴性，所以可能會被重排序。假如發生了重排序，在線程1執行過程當中先執行語句2，而此是線程2會覺得初始化工做已經完成，那麼就會跳出while循環，去執行doSomethingwithconfig(context)方法，而此時context並無被初始化，就會致使程序出錯。
從上面能夠看出，指令重排序不會影響單個線程的執行，可是會影響到線程併發執行的正確性。
也就是說，要想併發程序正確地執行，必需要保證原子性、可見性以及有序性。只要有一個沒有被保證，就有可能會致使程序運行不正確。

3.Java內存模型

在前面談到了一些關於內存模型以及併發編程中可能會出現的一些問題。下面咱們來看一下Java內存模型，研究一下Java內存模型爲咱們提供了哪些保證以及在java中提供了哪些方法和機制來讓咱們在進行多線程編程時可以保證程序執行的正確性。
在Java虛擬機規範中試圖定義一種Java內存模型（Java Memory Model，JMM）來屏蔽各個硬件平臺和操做系統的內存訪問差別，以實現讓Java程序在各類平臺下都能達到一致的內存訪問效果。那麼Java內存模型規定了哪些東西呢，它定義了程序中變量的訪問規則，往大一點說是定義了程序執行的次序。注意，爲了得到較好的執行性能，Java內存模型並無限制執行引擎使用處理器的寄存器或者高速緩存來提高指令執行速度，也沒有限制編譯器對指令進行重排序。也就是說，在java內存模型中，也會存在緩存一致性問題和指令重排序的問題。
Java內存模型規定全部的變量都是存在主存當中（相似於前面說的物理內存），每一個線程都有本身的工做內存（相似於前面的高速緩存）。線程對變量的全部操做都必須在工做內存中進行，而不能直接對主存進行操做。而且每一個線程不能訪問其餘線程的工做內存。
舉個簡單的例子：在java中，執行下面這個語句：

i = 10
複製代碼

執行線程必須先在本身的工做線程中對變量i所在的緩存行進行賦值操做，而後再寫入主存當中。而不是直接將數值10寫入主存當中。
那麼Java語言自己對原子性、可見性以及有序性提供了哪些保證呢？

3.1 原子性

在Java中，對基本數據類型的變量的讀取和賦值操做是原子性操做，即這些操做是不可被中斷的，要麼執行，要麼不執行。上面一句話雖然看起來簡單，可是理解起來並非那麼容易。看下面一個例子i：請分析如下哪些操做是原子性操做：

x = 10;         //語句1
y = x;         //語句2
x++;           //語句3
x = x + 1;     //語句4
複製代碼

咋一看，有些朋友可能會說上面的4個語句中的操做都是原子性操做。其實只有語句1是原子性操做，其餘三個語句都不是原子性操做。
語句1是直接將數值10賦值給x，也就是說線程執行這個語句的會直接將數值10寫入到工做內存中。
語句2實際上包含2個操做，它先要去讀取x的值，再將x的值寫入工做內存，雖然讀取x的值以及將x的值寫入工做內存這2個操做都是原子性操做，可是合起來就不是原子性操做了。一樣的，x++和 x = x+1包括3個操做：讀取x的值，進行加1操做，寫入新的值。
因此上面4個語句只有語句1的操做具有原子性。
也就是說，只有簡單的讀取、賦值（並且必須是將數字賦值給某個變量，變量之間的相互賦值不是原子操做）纔是原子操做。不過這裏有一點須要注意：在32位平臺下，對64位數據的讀取和賦值是須要經過兩個操做來完成的，不能保證其原子性。可是好像在最新的JDK中，JVM已經保證對64位數據的讀取和賦值也是原子性操做了。
從上面能夠看出，Java內存模型只保證了基本讀取和賦值是原子性操做，若是要實現更大範圍操做的原子性，能夠經過synchronized和Lock來實現。因爲synchronized和Lock可以保證任一時刻只有一個線程執行該代碼塊，那麼天然就不存在原子性問題了，從而保證了原子性。

3.2 可見性

對於可見性，Java提供了volatile關鍵字來保證可見性。
當一個共享變量被volatile修飾時，它會保證修改的值會當即被更新到主存，當有其餘線程須要讀取時，它會去內存中讀取新值。
而普通的共享變量不能保證可見性，由於普通共享變量被修改以後，何時被寫入主存是不肯定的，當其餘線程去讀取時，此時內存中可能仍是原來的舊值，所以沒法保證可見性。
另外，經過synchronized和Lock也可以保證可見性，synchronized和Lock能保證同一時刻只有一個線程獲取鎖而後執行同步代碼，而且在釋放鎖以前會將對變量的修改刷新到主存當中。所以能夠保證可見性。

3.3 有序性

在Java內存模型中，容許編譯器和處理器對指令進行重排序，可是重排序過程不會影響到單線程程序的執行，卻會影響到多線程併發執行的正確性。
在Java裏面，能夠經過volatile關鍵字來保證必定的「有序性」（具體原理在下一節講述）。另外能夠經過synchronized和Lock來保證有序性，很顯然，synchronized和Lock保證每一個時刻是有一個線程執行同步代碼，至關因而讓線程順序執行同步代碼，天然就保證了有序性。
另外，Java內存模型具有一些先天的「有序性」，即不須要經過任何手段就可以獲得保證的有序性，這個一般也稱爲 happens-before 原則。若是兩個操做的執行次序沒法從happens-before原則推導出來，那麼它們就不能保證它們的有序性，虛擬機能夠隨意地對它們進行重排序。
下面就來具體介紹下happens-before原則（先行發生原則）：

程序次序規則：一個線程內，按照代碼順序，書寫在前面的操做先行發生於書寫在後面的操做
鎖定規則：一個unLock操做先行發生於後面對同一個鎖額lock操做
volatile變量規則：對一個變量的寫操做先行發生於後面對這個變量的讀操做
傳遞規則：若是操做A先行發生於操做B，而操做B又先行發生於操做C，則能夠得出操做A先行發生於操做C
線程啓動規則：Thread對象的start()方法先行發生於此線程的每一個一個動做
線程中斷規則：對線程interrupt()方法的調用先行發生於被中斷線程的代碼檢測到中斷事件的發生
線程終結規則：線程中全部的操做都先行發生於線程的終止檢測，咱們能夠經過Thread.join()方法結束、Thread.isAlive()的返回值手段檢測到線程已經終止執行
對象終結規則：一個對象的初始化完成先行發生於他的finalize()方法的開始這8條原則摘自《深刻理解Java虛擬機》。這8條規則中，前4條規則是比較重要的，後4條規則都是顯而易見的。下面咱們來解釋一下前4條規則：對於程序次序規則來講，個人理解就是一段程序代碼的執行在單個線程中看起來是有序的。注意，雖然這條規則中提到「書寫在前面的操做先行發生於書寫在後面的操做」，這個應該是程序看起來執行的順序是按照代碼順序執行的，由於虛擬機可能會對程序代碼進行指令重排序。雖然進行重排序，可是最終執行的結果是與程序順序執行的結果一致的，它只會對不存在數據依賴性的指令進行重排序。所以，在單個線程中，程序執行看起來是有序執行的，這一點要注意理解。事實上，這個規則是用來保證程序在單線程中執行結果的正確性，但沒法保證程序在多線程中執行的正確性。第二條規則也比較容易理解，也就是說不管在單線程中仍是多線程中，同一個鎖若是出於被鎖定的狀態，那麼必須先對鎖進行了釋放操做，後面才能繼續進行lock操做。第三條規則是一條比較重要的規則，也是後文將要重點講述的內容。直觀地解釋就是，若是一個線程先去寫一個變量，而後一個線程去進行讀取，那麼寫入操做確定會先行發生於讀操做。第四條規則實際上就是體現happens-before原則具有傳遞性。