雙重檢查鎖定原理詳解

Java程序中,有時候可能須要推遲一些高開銷的對象初始化操做,而且只有在使用這些對象時才進行初始化。此時程序員可能會採用延遲初始化。但要正確實現線程安全的延遲初始化須要一些技巧,不然很容易出現問題。好比,下面是非線程安全的延遲初始化對象的示例代碼:java

public class UnsafeLazyInitialization {
    private static Instance instance;
    public static Instance getInstance() {
        if (instance == null) //1:A線程執行
            instance = new Instance(); //2:B線程執行
        return instance;
    }
}

在UnsafeLazyInitialization中,假設A線程執行代碼1的同時,B線程執行代碼2。此時,線程A可能會看到instance引用的對象尚未完成初始化(出現這種狀況的緣由見後文的「問題的根源」)。程序員

對於UnsafeLazyInitialization,咱們能夠對getInstance()作同步處理來實現線程安全的延遲初始化。示例代碼以下:安全

public class SafeLazyInitialization {
    private static Instance instance;

    public synchronized static Instance getInstance() {
        if (instance == null)
            instance = new Instance();
        return instance;
    }
}

因爲對getInstance()作了同步處理,synchronized將致使性能開銷。若是getInstance()被多個線程頻繁的調用,將會致使程序執行性能的降低。反之,若是getInstance()不會被多個線程頻繁的調用,那麼這個延遲初始化方案將能提供使人滿意的性能。多線程

在早期的JVM中,synchronized(甚至是無競爭的synchronized)存在這巨大的性能開銷。所以,人們想出了一個「聰明」的技巧:雙重檢查鎖定(double-checked locking)。人們想經過雙重檢查鎖定來下降同步的開銷。下面是使用雙重檢查鎖定來實現延遲初始化的示例代碼:併發

public class DoubleCheckedLocking {                 //1
    private static Instance instance;                    //2

    public static Instance getInstance() {               //3
        if (instance == null) {                          //4:第一次檢查
            synchronized (DoubleCheckedLocking.class) {  //5:加鎖
                if (instance == null)                    //6:第二次檢查
                    instance = new Instance();           //7:問題的根源出在這裏
            }                                            //8
        }                                                //9
        return instance;                                 //10
    }                                                    //11
}

如上面代碼所示,若是第一次檢查instance不爲null,那麼就不須要執行下面的加鎖和初始化操做。所以能夠大幅下降synchronized帶來的性能開銷。上面代碼表面上看起來,彷佛一箭雙鵰:app

  • 在多個線程試圖在同一時間建立對象時,會經過加鎖來保證只有一個線程能建立對象。
  • 在對象建立好以後,執行getInstance()將不須要獲取鎖,直接返回已建立好的對象。

雙重檢查鎖定看起來彷佛很完美,但這是一個錯誤的優化!在線程執行到第4行代碼讀取到instance不爲null時,instance引用的對象有可能尚未完成初始化。性能

問題的根源

前面的雙重檢查鎖定示例代碼的第7行(instance = new Singleton();)建立一個對象。這一行代碼能夠分解爲以下的三行僞代碼:優化

memory = allocate();   //1:分配對象的內存空間
ctorInstance(memory);  //2:初始化對象
instance = memory;     //3:設置instance指向剛分配的內存地址

上面三行僞代碼中的2和3之間,可能會被重排序(在一些JIT編譯器上,這種重排序是真實發生的,詳情見參考文獻1的「Out-of-order writes」部分)。2和3之間重排序以後的執行時序以下:spa

memory = allocate();   //1:分配對象的內存空間
instance = memory;     //3:設置instance指向剛分配的內存地址
                       //注意,此時對象尚未被初始化!
ctorInstance(memory);  //2:初始化對象

根據《The Java Language Specification, java SE 7 Edition》(後文簡稱爲java語言規範),全部線程在執行java程序時必需要遵照intra-thread semantics。intra-thread semantics保證重排序不會改變單線程內的程序執行結果。換句話來講,intra-thread semantics容許那些在單線程內,不會改變單線程程序執行結果的重排序。上面三行僞代碼的2和3之間雖然被重排序了,但這個重排序並不會違反intra-thread semantics。這個重排序在沒有改變單線程程序的執行結果的前提下,能夠提升程序的執行性能。.net

爲了更好的理解intra-thread semantics,請看下面的示意圖(假設一個線程A在構造對象後,當即訪問這個對象):

如上圖所示,只要保證2排在4的前面,即便2和3之間重排序了,也不會違反intra-thread semantics。

下面,再讓咱們看看多線程併發執行的時候的狀況。請看下面的示意圖:

因爲單線程內要遵照intra-thread semantics,從而能保證A線程的程序執行結果不會被改變。可是當線程A和B按上圖的時序執行時,B線程將看到一個尚未被初始化的對象。

※注:本文統一用紅色的虛箭線標識錯誤的讀操做,用綠色的虛箭線標識正確的讀操做。

回到本文的主題,DoubleCheckedLocking示例代碼的第7行(instance = new Singleton();)若是發生重排序,另外一個併發執行的線程B就有可能在第4行判斷instance不爲null。線程B接下來將訪問instance所引用的對象,但此時這個對象可能尚未被A線程初始化!下面是這個場景的具體執行時序:

時間

線程A

線程B

t1

A1:分配對象的內存空間

 

t2

A3:設置instance指向內存空間

 

t3

 

B1:判斷instance是否爲空

t4

 

B2:因爲instance不爲null,線程B將訪問instance引用的對象

t5

A2:初始化對象

 

t6

A4:訪問instance引用的對象

 

這裏A2和A3雖然重排序了,但java內存模型的intra-thread semantics將確保A2必定會排在A4前面執行。所以線程A的intra-thread semantics沒有改變。但A2和A3的重排序,將致使線程B在B1處判斷出instance不爲空,線程B接下來將訪問instance引用的對象。此時,線程B將會訪問到一個還未初始化的對象。

在知曉了問題發生的根源以後,咱們能夠想出兩個辦法來實現線程安全的延遲初始化:

  1. 不容許2和3重排序;
  2. 容許2和3重排序,但不容許其餘線程「看到」這個重排序。

後文介紹的兩個解決方案,分別對應於上面這兩點。

基於volatile的雙重檢查鎖定的解決方案

對於前面的基於雙重檢查鎖定來實現延遲初始化的方案(指DoubleCheckedLocking示例代碼),咱們只須要作一點小的修改(把instance聲明爲volatile型),就能夠實現線程安全的延遲初始化。請看下面的示例代碼:

public class SafeDoubleCheckedLocking {
    private volatile static Instance instance;

    public static Instance getInstance() {
        if (instance == null) {
            synchronized (SafeDoubleCheckedLocking.class) {
                if (instance == null)
                    instance = new Instance();//instance爲volatile,如今沒問題了
            }
        }
        return instance;
    }
}

注意,這個解決方案須要JDK5或更高版本(由於從JDK5開始使用新的JSR-133內存模型規範,這個規範加強了volatile的語義)。

當聲明對象的引用爲volatile後,「問題的根源」的三行僞代碼中的2和3之間的重排序,在多線程環境中將會被禁止。上面示例代碼將按以下的時序執行:

這個方案本質上是經過禁止上圖中的2和3之間的重排序,來保證線程安全的延遲初始化。

基於類初始化的解決方案

JVM在類的初始化階段(即在Class被加載後,且被線程使用以前),會執行類的初始化。在執行類的初始化期間,JVM會去獲取一個鎖。這個鎖能夠同步多個線程對同一個類的初始化。

基於這個特性,能夠實現另外一種線程安全的延遲初始化方案(這個方案被稱之爲Initialization On Demand Holder idiom):

public class InstanceFactory {
    private static class InstanceHolder {
        public static Instance instance = new Instance();
    }

    public static Instance getInstance() {
        return InstanceHolder.instance ;  //這裏將致使InstanceHolder類被初始化
    }
}

假設兩個線程併發執行getInstance(),下面是執行的示意圖:

這個方案的實質是:容許「問題的根源」的三行僞代碼中的2和3重排序,但不容許非構造線程(這裏指線程B)「看到」這個重排序。

初始化一個類,包括執行這個類的靜態初始化和初始化在這個類中聲明的靜態字段。根據java語言規範,在首次發生下列任意一種狀況時,一個類或接口類型T將被當即初始化:

  • T是一個類,並且一個T類型的實例被建立;
  • T是一個類,且T中聲明的一個靜態方法被調用;
  • T中聲明的一個靜態字段被賦值;
  • T中聲明的一個靜態字段被使用,並且這個字段不是一個常量字段;
  • T是一個頂級類(top level class,見java語言規範的§7.6),並且一個斷言語句嵌套在T內部被執行。

在InstanceFactory示例代碼中,首次執行getInstance()的線程將致使InstanceHolder類被初始化(符合狀況4)。

因爲java語言是多線程的,多個線程可能在同一時間嘗試去初始化同一個類或接口(好比這裏多個線程可能在同一時刻調用getInstance()來初始化InstanceHolder類)。所以在java中初始化一個類或者接口時,須要作細緻的同步處理。

Java語言規範規定,對於每個類或接口C,都有一個惟一的初始化鎖LC與之對應。從C到LC的映射,由JVM的具體實現去自由實現。JVM在類初始化期間會獲取這個初始化鎖,而且每一個線程至少獲取一次鎖來確保這個類已經被初始化過了(事實上,java語言規範容許JVM的具體實如今這裏作一些優化,見後文的說明)。

對於類或接口的初始化,java語言規範制定了精巧而複雜的類初始化處理過程。java初始化一個類或接口的處理過程以下(這裏對類初始化處理過程的說明,省略了與本文無關的部分;同時爲了更好的說明類初始化過程當中的同步處理機制,筆者人爲的把類初始化的處理過程分爲了五個階段):

第一階段:經過在Class對象上同步(即獲取Class對象的初始化鎖),來控制類或接口的初始化。這個獲取鎖的線程會一直等待,直到當前線程可以獲取到這個初始化鎖。

假設Class對象當前尚未被初始化(初始化狀態state此時被標記爲state = noInitialization),且有兩個線程A和B試圖同時初始化這個Class對象。下面是對應的示意圖:

下面是這個示意圖的說明:

時間

線程A

線程B

t1

A1:嘗試獲取Class對象的初始化鎖。這裏假設線程A獲取到了初始化鎖

B1:嘗試獲取Class對象的初始化鎖,因爲線程A獲取到了鎖,線程B將一直等待獲取初始化鎖

t2

A2:線程A看到線程還未被初始化(由於讀取到state == noInitialization),線程設置state = initializing

 

t3

A3:線程A釋放初始化鎖

 

第二階段:線程A執行類的初始化,同時線程B在初始化鎖對應的condition上等待:

下面是這個示意圖的說明:

時間

線程A

線程B

t1

A1:執行類的靜態初始化和初始化類中聲明的靜態字段

B1:獲取到初始化鎖

t2

 

B2:讀取到state == initializing

t3

 

B3:釋放初始化鎖

t4

 

B4:在初始化鎖的condition中等待

第三階段:線程A設置state = initialized,而後喚醒在condition中等待的全部線程:

下面是這個示意圖的說明:

時間

線程A

t1

A1:獲取初始化鎖

t2

A2:設置state = initialized

t3

A3:喚醒在condition中等待的全部線程

t4

A4:釋放初始化鎖

t5

A5:線程A的初始化處理過程完成

第四階段:線程B結束類的初始化處理:

下面是這個示意圖的說明:

時間

線程B

t1

B1:獲取初始化鎖

t2

B2:讀取到state == initialized

t3

B3:釋放初始化鎖

t4

B4:線程B的類初始化處理過程完成

線程A在第二階段的A1執行類的初始化,並在第三階段的A4釋放初始化鎖;線程B在第四階段的B1獲取同一個初始化鎖,並在第四階段的B4以後纔開始訪問這個類。根據java內存模型規範的鎖規則,這裏將存在以下的happens-before關係:

這個happens-before關係將保證:線程A執行類的初始化時的寫入操做(執行類的靜態初始化和初始化類中聲明的靜態字段),線程B必定能看到。

第五階段:線程C執行類的初始化的處理:

下面是這個示意圖的說明:

時間

線程B

t1

C1:獲取初始化鎖

t2

C2:讀取到state == initialized

t3

C3:釋放初始化鎖

t4

C4:線程C的類初始化處理過程完成

在第三階段以後,類已經完成了初始化。所以線程C在第五階段的類初始化處理過程相對簡單一些(前面的線程A和B的類初始化處理過程都經歷了兩次鎖獲取-鎖釋放,而線程C的類初始化處理只須要經歷一次鎖獲取-鎖釋放)。

線程A在第二階段的A1執行類的初始化,並在第三階段的A4釋放鎖;線程C在第五階段的C1獲取同一個鎖,並在在第五階段的C4以後纔開始訪問這個類。根據java內存模型規範的鎖規則,這裏將存在以下的happens-before關係:

這個happens-before關係將保證:線程A執行類的初始化時的寫入操做,線程C必定能看到。

※注1:這裏的condition和state標記是本文虛構出來的。Java語言規範並無硬性規定必定要使用condition和state標記。JVM的具體實現只要實現相似功能便可。

※注2:Java語言規範容許Java的具體實現,優化類的初始化處理過程(對這裏的第五階段作優化),具體細節參見java語言規範的12.4.2章。

經過對比基於volatile的雙重檢查鎖定的方案和基於類初始化的方案,咱們會發現基於類初始化的方案的實現代碼更簡潔。但基於volatile的雙重檢查鎖定的方案有一個額外的優點:除了能夠對靜態字段實現延遲初始化外,還能夠對實例字段實現延遲初始化。

總結

延遲初始化下降了初始化類或建立實例的開銷,但增長了訪問被延遲初始化的字段的開銷。在大多數時候,正常的初始化要優於延遲初始化。若是確實須要對實例字段使用線程安全的延遲初始化,請使用上面介紹的基於volatile的延遲初始化的方案;若是確實須要對靜態字段使用線程安全的延遲初始化,請使用上面介紹的基於類初始化的方案。

相關文章
相關標籤/搜索