【轉】深刻理解Java內存模型（二）——重排序

時間 2019-11-11

標籤深刻理解 java 內存模型排序欄目 Java 简体版

原文原文鏈接

數據依賴性

若是兩個操做訪問同一個變量，且這兩個操做中有一個爲寫操做，此時這兩個操做之間就存在數據依賴性。數據依賴分下列三種類型：java

名稱	代碼示例	說明
寫後讀	a = 1;b = a;	寫一個變量以後，再讀這個位置。
寫後寫	a = 1;a = 2;	寫一個變量以後，再寫這個變量。
讀後寫	a = b;b = 1;	讀一個變量以後，再寫這個變量。

上面三種狀況，只要重排序兩個操做的執行順序，程序的執行結果將會被改變。程序員

前面提到過，編譯器和處理器可能會對操做作重排序。編譯器和處理器在重排序時，會遵照數據依賴性，編譯器和處理器不會改變存在數據依賴關係的兩個操做的執行順序。緩存

注意，這裏所說的數據依賴性僅針對單個處理器中執行的指令序列和單個線程中執行的操做，不一樣處理器之間和不一樣線程之間的數據依賴性不被編譯器和處理器考慮。多線程

as-if-serial語義

as-if-serial語義的意思指：無論怎麼重排序（編譯器和處理器爲了提升並行度），（單線程）程序的執行結果不能被改變。編譯器，runtime 和處理器都必須遵照as-if-serial語義。app

爲了遵照as-if-serial語義，編譯器和處理器不會對存在數據依賴關係的操做作重排序，由於這種重排序會改變執行結果。可是，若是操做之間不存在數據依賴關係，這些操做可能被編譯器和處理器重排序。爲了具體說明，請看下面計算圓面積的代碼示例：spa

double pi  = 3.14;    //A
double r   = 1.0;     //B
double area = pi * r * r; //C

上面三個操做的數據依賴關係以下圖所示：線程

如上圖所示，A和C之間存在數據依賴關係，同時B和C之間也存在數據依賴關係。所以在最終執行的指令序列中，C不能被重排序到A和B的前面（C排到A和B的前面，程序的結果將會被改變）。但A和B之間沒有數據依賴關係，編譯器和處理器能夠重排序A和B之間的執行順序。下圖是該程序的兩種執行順序：排序

as-if-serial語義把單線程程序保護了起來，遵照as-if-serial語義的編譯器，runtime 和處理器共同爲編寫單線程程序的程序員建立了一個幻覺：單線程程序是按程序的順序來執行的。as-if-serial語義使單線程程序員無需擔憂重排序會干擾他們，也無需擔憂內存可見性問題。內存

程序順序規則

根據happens- before的程序順序規則，上面計算圓的面積的示例代碼存在三個happens- before關係：開發

A happens- before B；
B happens- before C；
A happens- before C；

這裏的第3個happens- before關係，是根據happens- before的傳遞性推導出來的。

這裏A happens- before B，但實際執行時B卻能夠排在A以前執行（看上面的重排序後的執行順序）。在第一章提到過，若是A happens- before B，JMM並不要求A必定要在B以前執行。JMM僅僅要求前一個操做（執行的結果）對後一個操做可見，且前一個操做按順序排在第二個操做以前。這裏操做A的執行結果不須要對操做B可見；並且重排序操做A和操做B後的執行結果，與操做A和操做B按happens- before順序執行的結果一致。在這種狀況下，JMM會認爲這種重排序並不非法（not illegal），JMM容許這種重排序。

在計算機中，軟件技術和硬件技術有一個共同的目標：在不改變程序執行結果的前提下，儘量的開發並行度。編譯器和處理器聽從這一目標，從happens- before的定義咱們能夠看出，JMM一樣聽從這一目標。

重排序對多線程的影響

如今讓咱們來看看，重排序是否會改變多線程程序的執行結果。請看下面的示例代碼：

class ReorderExample {
int a = 0;
boolean flag = false;

public void writer() {
    a = 1;                   //1
    flag = true;             //2
}

Public void reader() {
    if (flag) {                //3
        int i =  a * a;        //4
        ……
    }
}
}

flag變量是個標記，用來標識變量a是否已被寫入。這裏假設有兩個線程A和B，A首先執行writer()方法，隨後B線程接着執行reader()方法。線程B在執行操做4時，可否看到線程A在操做1對共享變量a的寫入？

答案是：不必定能看到。

因爲操做1和操做2沒有數據依賴關係，編譯器和處理器能夠對這兩個操做重排序；一樣，操做3和操做4沒有數據依賴關係，編譯器和處理器也能夠對這兩個操做重排序。讓咱們先來看看，當操做1和操做2重排序時，可能會產生什麼效果？請看下面的程序執行時序圖：

如上圖所示，操做1和操做2作了重排序。程序執行時，線程A首先寫標記變量flag，隨後線程B讀這個變量。因爲條件判斷爲真，線程B將讀取變量a。此時，變量a還根本沒有被線程A寫入，在這裏多線程程序的語義被重排序破壞了！

※注：本文統一用紅色的虛箭線表示錯誤的讀操做，用綠色的虛箭線表示正確的讀操做。

下面再讓咱們看看，當操做3和操做4重排序時會產生什麼效果（藉助這個重排序，能夠順便說明控制依賴性）。下面是操做3和操做4重排序後，程序的執行時序圖：

在程序中，操做3和操做4存在控制依賴關係。當代碼中存在控制依賴性時，會影響指令序列執行的並行度。爲此，編譯器和處理器會採用猜想（Speculation）執行來克服控制相關性對並行度的影響。以處理器的猜想執行爲例，執行線程B的處理器能夠提早讀取並計算a*a，而後把計算結果臨時保存到一個名爲重排序緩衝（reorder buffer ROB）的硬件緩存中。當接下來操做3的條件判斷爲真時，就把該計算結果寫入變量i中。

從圖中咱們能夠看出，猜想執行實質上對操做3和4作了重排序。重排序在這裏破壞了多線程程序的語義！

在單線程程序中，對存在控制依賴的操做重排序，不會改變執行結果（這也是as-if-serial語義容許對存在控制依賴的操做作重排序的緣由）；但在多線程程序中，對存在控制依賴的操做重排序，可能會改變程序的執行結果。

轉自：http://www.infoq.com/cn/articles/java-memory-model-2/