深刻理解CAS算法原理

一、什麼是CAS?

CAS:Compare and Swap,即比較再交換。java

jdk5增長了併發包java.util.concurrent.*,其下面的類使用CAS算法實現了區別於synchronouse同步鎖的一種樂觀鎖。JDK 5以前Java語言是靠synchronized關鍵字保證同步的,這是一種獨佔鎖,也是是悲觀鎖。算法

二、CAS算法理解

對CAS的理解,CAS是一種無鎖算法,CAS有3個操做數,內存值V,舊的預期值A,要修改的新值B。當且僅當預期值A和內存值V相同時,將內存值V修改成B,不然什麼都不作。編程

CAS比較與交換的僞代碼能夠表示爲:緩存

do{   
       備份舊數據;  
       基於舊數據構造新數據;  
}while(!CAS( 內存地址,備份的舊數據,新數據 ))

三、CAS開銷

前面說過了,CAS(比較並交換)是CPU指令級的操做,只有一步原子操做,因此很是快。並且CAS避免了請求操做系統來裁定鎖的問題,不用麻煩操做系統,直接在CPU內部就搞定了。但CAS就沒有開銷了嗎?不!有cache miss的狀況。這個問題比較複雜,首先須要瞭解CPU的硬件體系結構: 數據結構

上圖能夠看到一個8核CPU計算機系統,每一個CPU有cache(CPU內部的高速緩存,寄存器),管芯內還帶有一個互聯模塊,使管芯內的兩個核能夠互相通訊。在圖中央的系統互聯模塊可讓四個管芯相互通訊,而且將管芯與主存鏈接起來。數據以「緩存線」爲單位在系統中傳輸,「緩存線」對應於內存中一個 2 的冪大小的字節塊,大小一般爲 32 到 256 字節之間。當 CPU 從內存中讀取一個變量到它的寄存器中時,必須首先將包含了該變量的緩存線讀取到 CPU 高速緩存。一樣地,CPU 將寄存器中的一個值存儲到內存時,不只必須將包含了該值的緩存線讀到 CPU 高速緩存,還必須確保沒有其餘 CPU 擁有該緩存線的拷貝。併發

好比,若是 CPU0 在對一個變量執行「比較並交換」(CAS)操做,而該變量所在的緩存線在 CPU7 的高速緩存中,就會發生如下通過簡化的事件序列:性能

  • CPU0 檢查本地高速緩存,沒有找到緩存線。atom

  • 請求被轉發到 CPU0 和 CPU1 的互聯模塊,檢查 CPU1 的本地高速緩存,沒有找到緩存線。操作系統

  • 請求被轉發到系統互聯模塊,檢查其餘三個管芯,得知緩存線被 CPU6和 CPU7 所在的管芯持有。code

  • 請求被轉發到 CPU6 和 CPU7 的互聯模塊,檢查這兩個 CPU 的高速緩存,在 CPU7 的高速緩存中找到緩存線。

  • CPU7 將緩存線發送給所屬的互聯模塊,而且刷新本身高速緩存中的緩存線。

  • CPU6 和 CPU7 的互聯模塊將緩存線發送給系統互聯模塊。

  • 系統互聯模塊將緩存線發送給 CPU0 和 CPU1 的互聯模塊。

  • CPU0 和 CPU1 的互聯模塊將緩存線發送給 CPU0 的高速緩存。

  • CPU0 如今能夠對高速緩存中的變量執行 CAS 操做了

以上是刷新不一樣CPU緩存的開銷。最好狀況下的 CAS 操做消耗大概 40 納秒,超過 60 個時鐘週期。這裏的「最好狀況」是指對某一個變量執行 CAS 操做的 CPU 正好是最後一個操做該變量的CPU,因此對應的緩存線已經在 CPU 的高速緩存中了,相似地,最好狀況下的鎖操做(一個「round trip 對」包括獲取鎖和隨後的釋放鎖)消耗超過 60 納秒,超過 100 個時鐘週期。這裏的「最好狀況」意味着用於表示鎖的數據結構已經在獲取和釋放鎖的 CPU 所屬的高速緩存中了。鎖操做比 CAS 操做更加耗時,是因深刻理解並行編程

爲鎖操做的數據結構中須要兩個原子操做。緩存未命中消耗大概 140 納秒,超過 200 個時鐘週期。須要在存儲新值時查詢變量的舊值的 CAS 操做,消耗大概 300 納秒,超過 500 個時鐘週期。想一想這個,在執行一次 CAS 操做的時間裏,CPU 能夠執行 500 條普通指令。這代表了細粒度鎖的侷限性。

如下是cache miss cas 和lock的性能對比:

四、CAS算法在JDK中的應用

在原子類變量中,如java.util.concurrent.atomic中的AtomicXXX,都使用了這些底層的JVM支持爲數字類型的引用類型提供一種高效的CAS操做,而在java.util.concurrent中的大多數類在實現時都直接或間接的使用了這些原子變量類。

Java 1.7中AtomicInteger.incrementAndGet()的實現源碼爲: 因而可知,AtomicInteger.incrementAndGet的實現用了樂觀鎖技術,調用了類sun.misc.Unsafe庫裏面的 CAS算法,用CPU指令來實現無鎖自增。因此,AtomicInteger.incrementAndGet的自增比用synchronized的鎖效率倍增。

相關文章
相關標籤/搜索