全面理解Java內存模型(轉)

時間 2019-11-09

標籤全面理解 java 內存模型欄目 Java 简体版

原文原文鏈接

轉自：http://blog.csdn.net/suifeng3051/article/details/52611310java

Java內存模型即Java Memory Model，簡稱JMM。JMM定義了Java 虛擬機(JVM)在計算機內存(RAM)中的工做方式。JVM是整個計算機虛擬模型，因此JMM是隸屬於JVM的。程序員

若是咱們要想深刻了解Java併發編程，就要先理解好Java內存模型。Java內存模型定義了多線程之間共享變量的可見性以及如何在須要的時候對共享變量進行同步。原始的Java內存模型效率並非很理想，所以Java1.5版本對其進行了重構，如今的Java8仍沿用了Java1.5的版本。編程

關於併發編程

在併發編程領域，有兩個關鍵問題：線程之間的通訊和同步。緩存

線程之間的通訊

線程的通訊是指線程之間以何種機制來交換信息。在命令式編程中，線程之間的通訊機制有兩種共享內存和消息傳遞。多線程

在共享內存的併發模型裏，線程之間共享程序的公共狀態，線程之間經過寫-讀內存中的公共狀態來隱式進行通訊，典型的共享內存通訊方式就是經過共享對象進行通訊。架構

在消息傳遞的併發模型裏，線程之間沒有公共狀態，線程之間必須經過明確的發送消息來顯式進行通訊，在java中典型的消息傳遞方式就是wait()和notify()。併發

關於Java線程之間的通訊，能夠參考線程之間的通訊（thread signal）。app

線程之間的同步

同步是指程序用於控制不一樣線程之間操做發生相對順序的機制。jvm

在共享內存併發模型裏，同步是顯式進行的。程序員必須顯式指定某個方法或某段代碼須要在線程之間互斥執行。性能

在消息傳遞的併發模型裏，因爲消息的發送必須在消息的接收以前，所以同步是隱式進行的。

Java的併發採用的是共享內存模型

Java線程之間的通訊老是隱式進行，整個通訊過程對程序員徹底透明。若是編寫多線程程序的Java程序員不理解隱式進行的線程之間通訊的工做機制，極可能會遇到各類奇怪的內存可見性問題。

Java內存模型

上面講到了Java線程之間的通訊採用的是過共享內存模型，這裏提到的共享內存模型指的就是Java內存模型(簡稱JMM)，JMM決定一個線程對共享變量的寫入什麼時候對另外一個線程可見。從抽象的角度來看，JMM定義了線程和主內存之間的抽象關係：線程之間的共享變量存儲在主內存（main memory）中，每一個線程都有一個私有的本地內存（local memory），本地內存中存儲了該線程以讀/寫共享變量的副本。本地內存是JMM的一個抽象概念，並不真實存在。它涵蓋了緩存，寫緩衝區，寄存器以及其餘的硬件和編譯器優化。

從上圖來看，線程A與線程B之間如要通訊的話，必需要經歷下面2個步驟：

1. 首先，線程A把本地內存A中更新過的共享變量刷新到主內存中去。
2. 而後，線程B到主內存中去讀取線程A以前已更新過的共享變量。

下面經過示意圖來講明這兩個步驟：

如上圖所示，本地內存A和B有主內存中共享變量x的副本。假設初始時，這三個內存中的x值都爲0。線程A在執行時，把更新後的x值（假設值爲1）臨時存放在本身的本地內存A中。當線程A和線程B須要通訊時，線程A首先會把本身本地內存中修改後的x值刷新到主內存中，此時主內存中的x值變爲了1。隨後，線程B到主內存中去讀取線程A更新後的x值，此時線程B的本地內存的x值也變爲了1。

從總體來看，這兩個步驟實質上是線程A在向線程B發送消息，並且這個通訊過程必需要通過主內存。JMM經過控制主內存與每一個線程的本地內存之間的交互，來爲java程序員提供內存可見性保證。

上面也說到了，Java內存模型只是一個抽象概念，那麼它在Java中具體是怎麼工做的呢？爲了更好的理解上Java內存模型工做方式，下面就JVM對Java內存模型的實現、硬件內存模型及它們之間的橋接作詳細介紹。

JVM對Java內存模型的實現

在JVM內部，Java內存模型把內存分紅了兩部分：線程棧區和堆區，下圖展現了Java內存模型在JVM中的邏輯視圖：

JVM中運行的每一個線程都擁有本身的線程棧，線程棧包含了當前線程執行的方法調用相關信息，咱們也把它稱做調用棧。隨着代碼的不斷執行，調用棧會不斷變化。

線程棧還包含了當前方法的全部本地變量信息。一個線程只能讀取本身的線程棧，也就是說，線程中的本地變量對其它線程是不可見的。即便兩個線程執行的是同一段代碼，它們也會各自在本身的線程棧中建立本地變量，所以，每一個線程中的本地變量都會有本身的版本。

全部原始類型(boolean,byte,short,char,int,long,float,double)的本地變量都直接保存在線程棧當中，對於它們的值各個線程之間都是獨立的。對於原始類型的本地變量，一個線程能夠傳遞一個副本給另外一個線程，當它們之間是沒法共享的。

堆區包含了Java應用建立的全部對象信息，無論對象是哪一個線程建立的，其中的對象包括原始類型的封裝類（如Byte、Integer、Long等等）。無論對象是屬於一個成員變量仍是方法中的本地變量，它都會被存儲在堆區。

下圖展現了調用棧和本地變量都存儲在棧區，對象都存儲在堆區：

一個本地變量若是是原始類型，那麼它會被徹底存儲到棧區。
一個本地變量也有多是一個對象的引用，這種狀況下，這個本地引用會被存儲到棧中，可是對象自己仍然存儲在堆區。

對於一個對象的成員方法，這些方法中包含本地變量，仍須要存儲在棧區，即便它們所屬的對象在堆區。
對於一個對象的成員變量，無論它是原始類型仍是包裝類型，都會被存儲到堆區。

Static類型的變量以及類自己相關信息都會隨着類自己存儲在堆區。

堆中的對象能夠被多線程共享。若是一個線程得到一個對象的應用，它即可訪問這個對象的成員變量。若是兩個線程同時調用了同一個對象的同一個方法，那麼這兩個線程即可同時訪問這個對象的成員變量，可是對於本地變量，每一個線程都會拷貝一份到本身的線程棧中。

下圖展現了上面描述的過程:

硬件內存架構

不論是什麼內存模型，最終仍是運行在計算機硬件上的，因此咱們有必要了解計算機硬件內存架構，下圖就簡單描述了當代計算機硬件內存架構：

現代計算機通常都有2個以上CPU，並且每一個CPU還有可能包含多個核心。所以，若是咱們的應用是多線程的話，這些線程可能會在各個CPU核心中並行運行。

在CPU內部有一組CPU寄存器，也就是CPU的儲存器。CPU操做寄存器的速度要比操做計算機主存快的多。在主存和CPU寄存器之間還存在一個CPU緩存，CPU操做CPU緩存的速度快於主存但慢於CPU寄存器。某些CPU可能有多個緩存層（一級緩存和二級緩存）。計算機的主存也稱做RAM，全部的CPU都可以訪問主存，並且主存比上面提到的緩存和寄存器大不少。

當一個CPU須要訪問主存時，會先讀取一部分主存數據到CPU緩存，進而在讀取CPU緩存到寄存器。當CPU須要寫數據到主存時，一樣會先flush寄存器到CPU緩存，而後再在某些節點把緩存數據flush到主存。

Java內存模型和硬件架構之間的橋接

正如上面講到的，Java內存模型和硬件內存架構並不一致。硬件內存架構中並無區分棧和堆，從硬件上看，不論是棧仍是堆，大部分數據都會存到主存中，固然一部分棧和堆的數據也有可能會存到CPU寄存器中，以下圖所示，Java內存模型和計算機硬件內存架構是一個交叉關係：

當對象和變量存儲到計算機的各個內存區域時，必然會面臨一些問題，其中最主要的兩個問題是：

1. 共享對象對各個線程的可見性
2. 共享對象的競爭現象

共享對象的可見性

當多個線程同時操做同一個共享對象時，若是沒有合理的使用volatile和synchronization關鍵字，一個線程對共享對象的更新有可能致使其它線程不可見。

想象一下咱們的共享對象存儲在主存，一個CPU中的線程讀取主存數據到CPU緩存，而後對共享對象作了更改，但CPU緩存中的更改後的對象尚未flush到主存，此時線程對共享對象的更改對其它CPU中的線程是不可見的。最終就是每一個線程最終都會拷貝共享對象，並且拷貝的對象位於不一樣的CPU緩存中。

下圖展現了上面描述的過程。左邊CPU中運行的線程從主存中拷貝共享對象obj到它的CPU緩存，把對象obj的count變量改成2。但這個變動對運行在右邊CPU中的線程不可見，由於這個更改尚未flush到主存中：

要解決共享對象可見性這個問題，咱們可使用java volatile關鍵字。 Java’s volatile keyword. volatile 關鍵字能夠保證變量會直接從主存讀取，而對變量的更新也會直接寫到主存。volatile原理是基於CPU內存屏障指令實現的，後面會講到。

競爭現象

若是多個線程共享一個對象，若是它們同時修改這個共享對象，這就產生了競爭現象。

以下圖所示，線程A和線程B共享一個對象obj。假設線程A從主存讀取Obj.count變量到本身的CPU緩存，同時，線程B也讀取了Obj.count變量到它的CPU緩存，而且這兩個線程都對Obj.count作了加1操做。此時，Obj.count加1操做被執行了兩次，不過都在不一樣的CPU緩存中。

若是這兩個加1操做是串行執行的，那麼Obj.count變量便會在原始值上加2，最終主存中的Obj.count的值會是3。然而下圖中兩個加1操做是並行的，不論是線程A仍是線程B先flush計算結果到主存，最終主存中的Obj.count只會增長1次變成2，儘管一共有兩次加1操做。

要解決上面的問題咱們可使用java synchronized代碼塊。synchronized代碼塊能夠保證同一個時刻只能有一個線程進入代碼競爭區，synchronized代碼塊也能保證代碼塊中全部變量都將會從主存中讀，當線程退出代碼塊時，對全部變量的更新將會flush到主存，無論這些變量是否是volatile類型的。