Java中的Copy-On-Write容器

時間 2019-11-09

標籤 java copy write 容器欄目 Java 简体版

原文原文鏈接

什麼是CopyOnWrite容器

CopyOnWrite容器即寫時複製的容器。通俗的理解是當咱們往一個容器添加元素的時候，不直接往當前容器添加，而是先將當前容器進行 Copy，複製出一個新的容器，而後新的容器裏添加元素，添加完元素以後，再將原容器的引用指向新的容器。這樣作的好處是咱們能夠對 CopyOnWrite容器進行併發的讀，而不須要加鎖，由於當前容器不會添加任何元素。因此CopyOnWrite容器也是一種讀寫分離的思想，讀和寫不一樣的容器。java

CopyOnWriteArrayList的實現原理

在使用CopyOnWriteArrayList以前，咱們先閱讀其源碼瞭解下它是如何實現的。如下代碼是向ArrayList裏添加元素，能夠發如今添加的時候是須要加鎖的，不然多線程寫的時候會Copy出N個副本出來。數組

`01`	`public` `boolean` `add(T e) {`

`02`	`final` `ReentrantLock lock =` `this.lock;`

`03`	`lock.lock();`

04 try {

05

`06`	`Object[] elements = getArray();`

07

`08`	`int` `len = elements.length;`

`09`	`// 複製出新數組`

10

`11`	`Object[] newElements = Arrays.copyOf(elements, len +` `1);`

`12`	`// 把新元素添加到新數組裏`

13

`14`	`newElements[len] = e;`

`15`	`// 把原數組引用指向新數組`

16

`17`	`setArray(newElements);`

18

`19`	`return` `true;`

20

`21`	`}` `finally` `{`

22

`23`	`lock.unlock();`

24

25 }

26

27 }

28

`29`	`final` `void` `setArray(Object[] a) {`

`30`	`array = a;`

31 }

讀的時候不須要加鎖，若是讀的時候有多個線程正在向ArrayList添加數據，讀仍是會讀到舊的數據，由於寫的時候不會鎖住舊的ArrayList。安全

`1`	`public` `E get(int` `index) {`

`2`	`return` `get(getArray(), index);`

3 }

JDK中並無提供CopyOnWriteMap，咱們能夠參考CopyOnWriteArrayList來實現一個，基本代碼以下：多線程

`01`	`import` `java.util.Collection;`

`02`	`import` `java.util.Map;`

`03`	`import` `java.util.Set;`

04

`05`	`public` `class` `CopyOnWriteMap<K, V>` `implements` `Map<K, V>, Cloneable {`

`06`	`private` `volatile` `Map<K, V> internalMap;`

07

`08`	`public` `CopyOnWriteMap() {`

`09`	`internalMap =` `new` `HashMap<K, V>();`

10 }

11

`12`	`public` `V put(K key, V value) {`

13

`14`	`synchronized` `(this) {`

`15`	`Map<K, V> newMap =` `new` `HashMap<K, V>(internalMap);`

`16`	`V val = newMap.put(key, value);`

`17`	`internalMap = newMap;`

`18`	`return` `val;`

19 }

20 }

21

`22`	`public` `V get(Object key) {`

`23`	`return` `internalMap.get(key);`

24 }

25

`26`	`public` `void` `putAll(Map<?` `extends` `K, ?` `extends` `V> newData) {`

`27`	`synchronized` `(this) {`

`28`	`Map<K, V> newMap =` `new` `HashMap<K, V>(internalMap);`

`29`	`newMap.putAll(newData);`

`30`	`internalMap = newMap;`

31 }

32 }

33 }

實現很簡單，只要瞭解了CopyOnWrite機制，咱們能夠實現各類CopyOnWrite容器，而且在不一樣的應用場景中使用。併發

CopyOnWrite的應用場景

CopyOnWrite併發容器用於讀多寫少的併發場景。好比白名單，黑名單，商品類目的訪問和更新場景，假如咱們有一個搜索網站，用戶在這個網站的搜索框中，輸入關鍵字搜索內容，可是某些關鍵字不容許被搜索。這些不能被搜索的關鍵字會被放在一個黑名單當中，黑名單天天晚上更新一次。當用戶搜索時，會檢查當前關鍵字在不在黑名單當中，若是在，則提示不能搜索。實現代碼以下：網站

`01`	`package` `com.ifeve.book;`

02

`03`	`import` `java.util.Map;`

04

`05`	`import` `com.ifeve.book.forkjoin.CopyOnWriteMap;`

06

07 /**

08 * 黑名單服務

09 *

`10`	`* @author fangtengfei`

11 *

12 */

`13`	`public` `class` `BlackListServiceImpl {`

14

`15`	`private` `static` `CopyOnWriteMap<String, Boolean> blackListMap =` `new` `CopyOnWriteMap<String, Boolean>(`

16 1000);

17

`18`	`public` `static` `boolean` `isBlackList(String id) {`

`19`	`return` `blackListMap.get(id) ==` `null` `?` `false` `:` `true;`

20 }

21

`22`	`public` `static` `void` `addBlackList(String id) {`

`23`	`blackListMap.put(id, Boolean.TRUE);`

24 }

25

26 /**

`27`	`* 批量添加黑名單`

28 *

`29`	`* @param ids`

30 */

`31`	`public` `static` `void` `addBlackList(Map<String,Boolean> ids) {`

`32`	`blackListMap.putAll(ids);`

33 }

34

35 }

代碼很簡單，可是使用CopyOnWriteMap須要注意兩件事情：this

1. 減小擴容開銷。根據實際須要，初始化CopyOnWriteMap的大小，避免寫時CopyOnWriteMap擴容的開銷。spa

2. 使用批量添加。由於每次添加，容器每次都會進行復制，因此減小添加次數，能夠減小容器的複製次數。如使用上面代碼裏的addBlackList方法。.net

CopyOnWrite的缺點

CopyOnWrite容器有不少優勢，可是同時也存在兩個問題，即內存佔用問題和數據一致性問題。因此在開發的時候須要注意一下。線程

內存佔用問題。由於CopyOnWrite的寫時複製機制，因此在進行寫操做的時候，內存裏會同時駐紮兩個對象的內存，舊的對象和新寫入的對象（注意:在複製的時候只是複製容器裏的引用，只是在寫的時候會建立新對象添加到新容器裏，而舊容器的對象還在使用，因此有兩份對象內存）。若是這些對象佔用的內存比較大，好比說200M左右，那麼再寫入100M數據進去，內存就會佔用300M，那麼這個時候頗有可能形成頻繁的Yong GC和Full GC。以前咱們系統中使用了一個服務因爲每晚使用CopyOnWrite機制更新大對象，形成了每晚15秒的Full GC，應用響應時間也隨之變長。

針對內存佔用問題，能夠經過壓縮容器中的元素的方法來減小大對象的內存消耗，好比，若是元素全是10進制的數字，能夠考慮把它壓縮成36進制或64進制。或者不使用CopyOnWrite容器，而使用其餘的併發容器，如ConcurrentHashMap。

數據一致性問題。CopyOnWrite容器只能保證數據的最終一致性，不能保證數據的實時一致性。因此若是你但願寫入的的數據，立刻能讀到，請不要使用CopyOnWrite容器。

關於C++的STL中，曾經也有過Copy-On-Write的玩法，參見陳皓的《C++ STL String類中的Copy-On-Write》，後來，由於有不少線程安全上的事，就被去掉了。