Java內存模型學習筆記（一）—— 基礎

時間 2020-06-18

標籤 java 內存模型學習筆記基礎欄目 Java 简体版

原文原文鏈接

一、併發編程模型的分類

在併發編程中，咱們須要處理兩個關鍵的問題：一、線程間如何通訊，二、線程間如何同步。通訊是指線程之間以何種機制來交換信息，同步是指程序用於不一樣線程之間操做發生相對順序的機制。java

在命令式編程中，線程之間的通訊機制有兩種：共享內存和消息傳遞。在共享內存的併發模型中，線程之間共享程序的公共狀態，線程之間經過寫-讀內存中的公共狀態來進行隱式的進行通訊。在消息傳遞的併發模型中，線程之間沒有公共狀態，線程之間必須經過明確的發送消息來顯式的進行通訊。程序員

在共享內存併發模型裏，同步是顯式進行的，由於程序員必須顯式地指定某種方式或者編寫某段代碼須要線程之間互斥執行。在消息傳遞的併發模型裏，因爲消息發送必須在消息的接收以前，所以同步是隱式進行的。編程

java的併發採用的是共享內存模型，java線程之間的通訊老是隱式進行的，整個通訊過程對程序員徹底透明，若是程序員不理解隱式進行的線程之間通訊的工做機制，那麼將會遇到各類莫名其妙的內存可見性問題。數組

二、JMM——java內存模型

在java中，全部的實例域、靜態域和數組元素都存儲在堆內存中，堆內存是線程之間共享的區域。局部變量、方法定義的參數和異常處理參數不會在線程之間共享，它們不會有內存可見性問題，也不受到內存模型的制約與影響。緩存

java線程之間的通訊由JMM(java內存模型)控制，JMM決定一個線程對共享變量的寫入什麼時候對另外一個線程可見。從抽象的角度來看，JMM定義了線程和主內存之間的抽象關係（高能預警！！）：線程之間共享的變量存儲在主內存（main memory）中，每個線程都有一個私有的本地內存（local memory）,本地內存中存儲的是該線程對共享變量的拷貝副本。注意：本地內存是JMM的一個抽象概念，並不真實存在。java內存模型的抽象示意圖以下：多線程

從圖上來看，線程A和線程B之間要通訊的話，必須經歷下面兩個步驟：併發

首先，線程A將本地內存中更新過的共享變量刷新到主內存中；app
而後，線程B到主內存中讀取共享變量（注意，此時的共享變量是被A更新過的）。性能

JMM模型兩條規定：優化

線程對共享變量的全部操做必須在本身的內存中進行，不能直接從主內存中讀寫；
不一樣線程之間沒法直接訪問其它線程工做內存中的變量，線程間變量值的傳遞須要經過主內存來完成。

來一個示意圖說明一下這件事：

如圖所示，線程A和線程B的都將主內存中共享變量X拷貝到本身的工做內存中。假設，初始值是 x = 0。線程A在本身的本地內存中將 x 的值改成了1，而後將這個修改過的x 刷寫到主內存中。線程B到主內存中讀取線程A修改過的值，此時，線程B的本地內存中的x的值也變成了1。這樣，線程A和線程B就完成了一次通訊。

回顧一下整個過程，從總體看來，這兩個步驟實質上是線程A在給線程B發消息，而這個過程必須依賴於主內存。JMM經過控制主內存與每一個線程的本地內存之間的交互，來提供內存可見性（一個線程對共享變量值的修改，可以及時地被其它線程看到）。

所以，要實現共享變量的可見性，必須保證兩點：

線程修改後的共享變量值可以及時從工做內存刷新到主內存中；
其餘線程可以及時的把共享變量的最新值從主內存更新到本身的工做內存中。

在Java語言層面支持的可見性實現原理方式有Synchronize和Volatile。

三、指令重排

在執行一段程序的時候，爲了性能，編譯器和處理器經常會對一些指令進行重排。重排序分爲三種類型：

編譯器優化的重排序：編譯器在不改變單線程語義的前提下，能夠從新安排語句的執行順序。
指令級並行的重排序：現代處理器採用了指令級並行技術來將多條指令重疊執行（計算機組成原理的課程中有講到）。若是不存在數據依賴性，處理器能夠改變語句對應機器指令的執行順序。
內存系統的重排序：因爲處理器使用緩存和讀寫緩衝區，這使得加載和存儲操做看上去多是在亂序執行。

從java源碼到最終實際執行的指令序列，分別會經歷下面三種重排序：

這些重排序可能致使多線程程序出現內存可見性問題。對於編譯器，JMM的編譯器重排序規則會禁止特定類型的編譯器重排序（不是全部的編譯器重排都禁止）。對於處理器排序，JMM的處理器重排序規則會要求java編譯器在生成指令序列時，插入特定類型的內存屏障（memory barriers，intel稱之爲memory fence）指令，經過內存屏障指令來禁止特定類型的處理器重排序（不是禁止全部的處理器重排序）。

JMM屬於語言級的內存模型，它確保不一樣的編譯器和不一樣的處理器平臺之上，經過禁止特定類型的編譯器重排序和處理器重排序指令，爲程序提供一致的內存可見性保證。

四、處理器重排序與內存屏障指令

現代的處理器使用寫緩衝區來臨時保存向內存中寫入的數據。寫緩衝區能夠保證指令流水線持續運行，它能夠避免處理器停頓下來等待向內存中寫入數據而產生的延遲。同時，經過批處理的方式刷新寫緩衝區，以及合併寫緩衝區對同一內存地址的屢次寫，能夠減小對內存總線的佔用。雖然寫緩衝區有這麼多好處，但每一個處理器上的寫緩衝區，僅僅對它所在的處理器可見。這個特性會對內存操做的執行順序產生重要的影響：處理器對內存的讀/寫操做的執行順序，不必定與內存實際發生的讀/寫操做順序一致！爲了具體說明，請看下面示例：

Processor A	Processor B
a = 1; //A1	b = 2; //B1
x = b; //A2	y = a; //B2

初始狀態：a = b = 0 ，處理器容許執行後獲得結果：x = y = 0

這裏處理器A和處理器B能夠同時把共享變量寫入本身的寫緩衝區（A1，B1），而後從內存中讀取另外一個共享變量（A2，B2），最後才把本身寫緩存區中保存的髒數據刷新到內存中（A3，B3）。當以這種時序執行時，程序就能夠獲得x = y = 0的結果。

從內存操做實際發生順序來看，直處處理器A執行A3來刷新本身的寫緩存區，寫操做A1纔算真執行了。雖然處理器A執行內存操做的順序爲：A1->A2，但內存操做實際發生的順序倒是：A2->A1。此時，處理器A的內存操做順序被重排序了（處理器B的狀況和處理器A同樣）。

這裏的關鍵是，因爲寫緩衝區僅對本身的處理器可見，它會致使處理器執行內存操做的順序可能會與內存實際的操做執行順序不一致。因爲現代的處理器都會使用寫緩衝區，所以現代的處理器都會容許對寫-讀操做重排序。

爲了保證內存可見性，java編譯器在生成指令序列的適當位置會插入內存屏障指令來禁止特定類型的處理器重排序。JMM把內存屏障指令分爲下列四類：

屏障類型	指令示例	說明
LoadLoadBarriers	Load1; LoadLoad; Load2	確保Load1數據的裝載，以前於Load2及全部後續裝載指令的裝載。
StoreStoreBarriers	Store1; StoreStore; Store2	確保Store1數據對其餘處理器可見（刷新到內存），以前於Store2 及全部後續存儲指令的存儲。
LoadStoreBarriers	Load1; LoadStore; Store2	確保Load1數據裝載，以前於Store2及全部後續的存儲指令刷新到內存。
StoreLoadBarriers	Store1; StoreLoad; Load2	確保Store1數據對其餘處理器變得可見（指刷新到內存），以前於Load2 及全部後續裝載指令的裝載。StoreLoad Barriers會使該屏障以前的全部內存訪問指令（存儲和裝載指令）完成以後，才執行該屏障以後的內存訪問指令。

StoreLoad Barriers是一個「全能型」的屏障，它同時具備其餘三個屏障的效果。現代的多處理器大都支持該屏障（其餘類型的屏障不必定被全部處理器支持）。執行該屏障開銷會很昂貴，由於當前處理器一般要把寫緩衝區中的數據所有刷新到內存中（buffer fully flush）。

總結：Java編譯器在生成指令序列的適當位置會插入內存屏障指令來禁止特定類型的處理器重排序，從而讓程序按咱們預想的流程去執行：

保證特定操做的執行順序；
影響某些數據（或則是某條指令的執行結果）的內存可見性。

五、Happens-Before規則

上面的內容講述了重排序原則，一會是編譯器重排序一會是處理器重排序，若是讓程序員再去了解這些底層的實現以及具體規則，那麼程序員的負擔就過重了，嚴重影響了併發編程的效率。

所以，JMM爲程序員在上層提供了happens-before規則，這樣咱們就能夠根據規則去推論跨線程的內存可見性問題，而不用再去理解底層重排序的規則。程序員對於兩個操做指令是否真的被重排序並不關心，程序員關心的是程序執行時的語義不能被改變（即執行結果不能被改變）。

從JDK5開始，java使用happens-before的概念來闡述操做之間的內存可見性。在JMM中，若是一個操做執行的結果須要對另外一個操做可見，那麼這兩個操做之間必需要存在happens-before關係。這裏提到的兩個操做既能夠是在一個線程以內，也能夠是在不一樣線程之間。

兩個操做之間具備happens-before關係，並不意味着前一個操做必需要在後一個操做以前執行！happens-before僅僅要求前一個操做（執行的結果）對後一個操做可見，且前一個操做按順序排在第二個操做以前（the first is visible to and ordered before the second）。

與程序員密切相關的happens-before規則以下：

程序順序規則：一個線程中的每一個操做，happens- before 於該線程中的任意後續操做；
監視器鎖規則：對一個監視器鎖的解鎖，happens- before 於隨後對這個監視器鎖的加鎖；
volatile變量規則：對一個volatile域的寫，happens- before 於任意後續對這個volatile域的讀；
傳遞性：若是A happens- before B，且B happens- before C，那麼A happens- before C；
線程start()規則：主線程A啓動線程B，線程B中能夠看到主線程啓動B以前的操做。也就是start() happens before 線程B中的操做；
線程join()規則：主線程A等待子線程B完成，當子線程B執行完畢後，主線程A能夠看到線程B的全部操做。也就是說，子線程B中的任意操做，happens-before join()的返回。