Java中的Copy-On-Write容器

Copy-On-Write簡稱COW,是一種用於程序設計中的優化策略。其基本思路是,從一開始你們都在共享同一個內容,當某我的想要修改這個內容的時 候,纔會真正把內容Copy出去造成一個新的內容而後再改,這是一種延時懶惰策略。從JDK1.5開始Java併發包裏提供了兩個使用 CopyOnWrite機制實現的併發容器,它們是CopyOnWriteArrayList和CopyOnWriteArraySet。 CopyOnWrite容器很是有用,能夠在很是多的併發場景中使用到。java

什麼是CopyOnWrite容器

CopyOnWrite容器即寫時複製的容器。通俗的理解是當咱們往一個容器添加元素的時候,不直接往當前容器添加,而是先將當前容器進行Copy,複製 出一個新的容器,而後新的容器裏添加元素,添加完元素以後,再將原容器的引用指向新的容器。這樣作的好處是咱們能夠對CopyOnWrite容器進行併發 的讀,而不須要加鎖,由於當前容器不會添加任何元素。因此CopyOnWrite容器也是一種讀寫分離的思想,讀和寫不一樣的容器。數組

CopyOnWriteArrayList的實現原理

在使用CopyOnWriteArrayList以前,咱們先閱讀其源碼瞭解下它是如何實現的。如下代碼是向ArrayList裏添加元素,能夠發如今添加的時候是須要加鎖的,不然多線程寫的時候會Copy出N個副本出來。多線程

[java] view plain copy 在CODE上查看代碼片派生到個人代碼片併發

  1. public boolean add(T e) {  優化

  2.     final ReentrantLock lock = this.lock;  網站

  3.     lock.lock();  this

  4.     try {  spa

  5.   

  6.         Object[] elements = getArray();  .net

  7.   

  8.         int len = elements.length;  線程

  9.         // 複製出新數組  

  10.   

  11.         Object[] newElements = Arrays.copyOf(elements, len + 1);  

  12.         // 把新元素添加到新數組裏  

  13.   

  14.         newElements[len] = e;  

  15.         // 把原數組引用指向新數組  

  16.   

  17.         setArray(newElements);  

  18.   

  19.         return true;  

  20.   

  21.     } finally {  

  22.   

  23.         lock.unlock();  

  24.   

  25.     }  

  26.   

  27. }  

  28.   

  29. final void setArray(Object[] a) {  

  30.     array = a;  

  31. }  


讀的時候不須要加鎖,若是讀的時候有多個線程正在向ArrayList添加數據,讀仍是會讀到舊的數據,由於寫的時候不會鎖住舊的ArrayList。

[java] view plain copy 在CODE上查看代碼片派生到個人代碼片

  1. public E get(int index) {  

  2.     return get(getArray(), index);  

  3. }  


JDK中並無提供CopyOnWriteMap,咱們能夠參考CopyOnWriteArrayList來實現一個,基本代碼以下:

[java] view plain copy 在CODE上查看代碼片派生到個人代碼片

  1. import java.util.Collection;  

  2. import java.util.Map;  

  3. import java.util.Set;  

  4.   

  5. public class CopyOnWriteMap<K, V> implements Map<K, V>, Cloneable {  

  6.     private volatile Map<K, V> internalMap;  

  7.   

  8.     public CopyOnWriteMap() {  

  9.         internalMap = new HashMap<K, V>();  

  10.     }  

  11.   

  12.     public V put(K key, V value) {  

  13.   

  14.         synchronized (this) {  

  15.             Map<K, V> newMap = new HashMap<K, V>(internalMap);  

  16.             V val = newMap.put(key, value);  

  17.             internalMap = newMap;  

  18.             return val;  

  19.         }  

  20.     }  

  21.   

  22.     public V get(Object key) {  

  23.         return internalMap.get(key);  

  24.     }  

  25.   

  26.     public void putAll(Map<? extends K, ? extends V> newData) {  

  27.         synchronized (this) {  

  28.             Map<K, V> newMap = new HashMap<K, V>(internalMap);  

  29.             newMap.putAll(newData);  

  30.             internalMap = newMap;  

  31.         }  

  32.     }  

  33. }  


實現很簡單,只要瞭解了CopyOnWrite機制,咱們能夠實現各類CopyOnWrite容器,而且在不一樣的應用場景中使用。

CopyOnWrite的應用場景

CopyOnWrite併發容器用於讀多寫少的併發場景。好比白名單,黑名單,商品類目的訪問和更新場景,假如咱們有一個搜索網站,用戶在這個網站的搜索 框中,輸入關鍵字搜索內容,可是某些關鍵字不容許被搜索。這些不能被搜索的關鍵字會被放在一個黑名單當中,黑名單天天晚上更新一次。當用戶搜索時,會檢查 當前關鍵字在不在黑名單當中,若是在,則提示不能搜索。實現代碼以下:

[java] view plain copy 在CODE上查看代碼片派生到個人代碼片

  1. package com.ifeve.book;  

  2.   

  3. import java.util.Map;  

  4.   

  5. import com.ifeve.book.forkjoin.CopyOnWriteMap;  

  6.   

  7. /** 

  8.  * 黑名單服務 

  9.  * 

  10.  * @author fangtengfei 

  11.  * 

  12.  */  

  13. public class BlackListServiceImpl {  

  14.   

  15.     private static CopyOnWriteMap<String, Boolean> blackListMap = new CopyOnWriteMap<String, Boolean>(  

  16.             1000);  

  17.   

  18.     public static boolean isBlackList(String id) {  

  19.         return blackListMap.get(id) == null ? false : true;  

  20.     }  

  21.   

  22.     public static void addBlackList(String id) {  

  23.         blackListMap.put(id, Boolean.TRUE);  

  24.     }  

  25.   

  26.     /** 

  27.      * 批量添加黑名單 

  28.      * 

  29.      * @param ids 

  30.      */  

  31.     public static void addBlackList(Map<String,Boolean> ids) {  

  32.         blackListMap.putAll(ids);  

  33.     }  

  34.   

  35. }  


代碼很簡單,可是使用CopyOnWriteMap須要注意兩件事情:

1. 減小擴容開銷。根據實際須要,初始化CopyOnWriteMap的大小,避免寫時CopyOnWriteMap擴容的開銷。

2. 使用批量添加。由於每次添加,容器每次都會進行復制,因此減小添加次數,能夠減小容器的複製次數。如使用上面代碼裏的addBlackList方法。

CopyOnWrite的缺點

CopyOnWrite容器有不少優勢,可是同時也存在兩個問題,即內存佔用問題和數據一致性問題。因此在開發的時候須要注意一下。

內存佔用問題。由於CopyOnWrite的寫時複製機制,因此在進行寫操做的時候,內存裏會同時駐紮兩個對象的內 存,舊的對象和新寫入的對象(注意:在複製的時候只是複製容器裏的引用,只是在寫的時候會建立新對象添加到新容器裏,而舊容器的對象還在使用,因此有兩份 對象內存)。若是這些對象佔用的內存比較大,好比說200M左右,那麼再寫入100M數據進去,內存就會佔用300M,那麼這個時候頗有可能形成頻繁的 Yong GC和Full GC。以前咱們系統中使用了一個服務因爲每晚使用CopyOnWrite機制更新大對象,形成了每晚15秒的Full GC,應用響應時間也隨之變長。

針對內存佔用問題,能夠經過壓縮容器中的元素的方法來減小大對象的內存消耗,好比,若是元素全是10進制的數字,能夠考慮把它壓縮成36進制或64進制。或者不使用CopyOnWrite容器,而使用其餘的併發容器,如ConcurrentHashMap

數據一致性問題。CopyOnWrite容器只能保證數據的最終一致性,不能保證數據的實時一致性。因此若是你但願寫入的的數據,立刻能讀到,請不要使用CopyOnWrite容器。

相關文章
相關標籤/搜索