Collections.synchronizedList 、CopyOnWriteArrayList、Vector介紹、源碼淺析與性能對比【文末福利】

時間 2020-02-02

標籤 collections.synchronizedlist collections synchronizedlist copyonwritearraylist vector 介紹源碼淺析性能對比欄目 Java 简体版

原文原文鏈接

ArrayList線程安全問題

衆所周知，ArrayList不是線程安全的，在併發場景使用ArrayList可能會致使add內容爲null,迭代時併發修改list內容拋ConcurrentModificationException異常等問題。java類庫裏面提供瞭如下三個輪子能夠實現線程安全的List，它們是html

Vector
Collections.synchronizedList
CopyOnWriteArrayList

本文簡要的分析了下它們線程安全的實現機制並對它們的讀，寫，迭代性能進行了對比。java

Vector

從JDK1.0開始，Vector便存在JDK中，Vector是一個線程安全的列表，底層採用數組實現。其線程安全的實現方式很是粗暴：Vector大部分方法和ArrayList都是相同的，只是加上了synchronized關鍵字，這種方式嚴重影響效率，所以，再也不推薦使用Vector了。JAVA官方文檔中這樣描述：面試

If a thread-safe implementation is not needed, it is recommended to use ArrayList in place of Vector.數據庫

若是不須要線程安全性，推薦使用ArrayList替代Vector編程

關鍵源碼以下：後端

public synchronized boolean add(E e) {
    modCount++;
    ensureCapacityHelper(elementCount + 1);
    elementData[elementCount++] = e;
    return true;
}

public synchronized boolean add(E e) {
    modCount++;
    ensureCapacityHelper(elementCount + 1);
    elementData[elementCount++] = e;
    return true;
}

public synchronized Iterator<E> iterator() {
    return new Itr();
}    

複製代碼

能夠看到Vector經過在方法級別上加入了synchronized關鍵字實現線程安全性。設計模式

Collections.synchronizedList

由於ArrayList不是線程安全的，JDK提供了一個Collections.synchronizedList靜態方法將一個非線程安全的List(並不只限ArrayList)包裝爲線程安全的List。使用方式以下：數組

List list = Collections.synchronizedList(new ArrayList());
複製代碼

根據文檔，轉換包裝後的list能夠實現add，remove，get等操做的線程安全性，可是對於迭代操做，Collections.synchronizedList並無提供相關機制，因此迭代時須要對包裝後的list（敲黑板，必須對包裝後的list進行加鎖，鎖其餘的不行）進行手動加鎖，使用方式以下：緩存

List list = Collections.synchronizedList(new ArrayList());
//必須對list進行加鎖
synchronized (list) {
  Iterator i = list.iterator();
  while (i.hasNext())
      foo(i.next());
}
複製代碼

這個地方要注意兩個地方：安全

迭代操做必須加鎖，可使用synchronized關鍵字修飾;
synchronized持有的監視器對象必須是synchronized (list),即包裝後的list,使用其餘對象如synchronized (new Object())會使add,remove等方法與迭代方法使用的鎖不一致，沒法實現徹底的線程安全性。

經過源碼可知Collections.synchronizedList生成了特定同步的SynchronizedCollection，生成的集合每一個同步操做都是持有mutex這個鎖，因此再進行操做時就是線程安全的集合了。關鍵地方已經加了註釋：

public static <T> List<T> synchronizedList(List<T> list) {
    return (list instanceof RandomAccess ?
            //ArrayList使用了SynchronizedRandomAccessList類
            new SynchronizedRandomAccessList<>(list) :
            new SynchronizedList<>(list));
}
//SynchronizedRandomAccessList繼承自SynchronizedList
static class SynchronizedRandomAccessList<E> extends SynchronizedList<E> implements RandomAccess {
}

//SynchronizedList對代碼塊進行了synchronized修飾來實現線程安全性
static class SynchronizedList<E> extends SynchronizedCollection<E> implements List<E> {
public E get(int index) {
    synchronized (mutex) {return list.get(index);}
    }
    public E set(int index, E element) {
        synchronized (mutex) {return list.set(index, element);}
    }
    public void add(int index, E element) {
        synchronized (mutex) {list.add(index, element);}
    }
    public E remove(int index) {
        synchronized (mutex) {return list.remove(index);}
    }   
    
    //迭代操做並未加鎖，因此須要手動同步
    public ListIterator<E> listIterator() {
            return list.listIterator(); 
    }
}

複製代碼

CopyOnWriteArrayList

CopyOnWriteArrayList是java.util.concurrent包下面的一個實現線程安全的List,顧名思義， Copy~On~Write~ArrayList在進行寫操做(add,remove,set等)時會進行Copy操做，能夠推測出在進行寫操做時CopyOnWriteArrayList性能應該不會很高。

先看一下 CopyOnWriteArrayList 的結構：

public class CopyOnWriteArrayList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable {
    private static final long serialVersionUID = 8673264195747942595L;

    /** The lock protecting all mutators */
    final transient ReentrantLock lock = new ReentrantLock();

    /** The array, accessed only via getArray/setArray. */
    private transient volatile Object[] array;
    
    /** * Creates an empty list. */
    public CopyOnWriteArrayList() {
        setArray(new Object[0]);
    }
}
複製代碼

能夠看到CopyOnWriteArrayList底層實現爲Object[] array數組。

添加元素：

public boolean add(E e) {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {
        Object[] elements = getArray();
        int len = elements.length;
        Object[] newElements = Arrays.copyOf(elements, len + 1);
        newElements[len] = e;
        setArray(newElements);
        return true;
    } finally {
        lock.unlock();
    }
}
複製代碼

能夠看到每次添加元素時都會進行Arrays.copyOf操做，代價很是昂貴。

讀的時候是不須要加鎖的，直接獲取。刪除和增長是須要加鎖的。

有兩點必須講一下。我認爲CopyOnWriteArrayList這個併發組件，其實反映的是兩個十分重要的分佈式理念：

（1）讀寫分離

咱們讀取CopyOnWriteArrayList的時候讀取的是CopyOnWriteArrayList中的Object[] array，可是修改的時候，操做的是一個新的Object[] array，讀和寫操做的不是同一個對象，這就是讀寫分離。這種技術數據庫用的很是多，在高併發下爲了緩解數據庫的壓力，即便作了緩存也要對數據庫作讀寫分離，讀的時候使用讀庫，寫的時候使用寫庫，而後讀庫、寫庫之間進行必定的同步，這樣就避免同一個庫上讀、寫的IO操做太多。

（2）最終一致

對CopyOnWriteArrayList來講，線程1讀取集合裏面的數據，未必是最新的數據。由於線程二、線程三、線程4四個線程都修改了CopyOnWriteArrayList裏面的數據，可是線程1拿到的仍是最老的那個Object[] array，新添加進去的數據並無，因此線程1讀取的內容未必準確。不過這些數據雖然對於線程1是不一致的，可是對於以後的線程必定是一致的，它們拿到的Object[] array必定是三個線程都操做完畢以後的Object array[]，這就是最終一致。最終一致對於分佈式系統也很是重要，它經過容忍必定時間的數據不一致，提高整個分佈式系統的可用性與分區容錯性。固然，最終一致並非任何場景都適用的，像火車站售票這種系統用戶對於數據的實時性要求很是很是高，就必須作成強一致性的。

性能對比

經過前面的分析可知

Vector對全部操做進行了synchronized關鍵字修飾，性能應該比較差
CopyOnWriteArrayList在寫操做時須要進行copy操做，讀性能較好，寫性能較差
Collections.synchronizedList性能較均衡，可是迭代操做並未加鎖，因此須要時須要額外注意

下面寫了個測試程序對三者的讀，寫，遍歷進程了測試來驗證下，測試機器信息以下：

操做系統:macOS High Sierra 10.13.6
CPU:2.8 GHz Intel Core i7
內存：16 GB 2133 MHz LPDDR3
複製代碼

測試代碼：

**
 * 比較Vector，Collections.synchronizedList，CopyOnWriteArrayList讀操做，寫操做，遍歷操做性能
 *
 * @author nauyus
 * @date 2020年01月29日
 */
public class ListPerformanceTest {

    /** * 併發數 */
    public final static int THREAD_COUNT = 64;
    /** * list大小 */
    public final static int SIZE = 10000;

    /** * 測試讀性能 * * @throws Exception */
    @Test
    public void testGet() throws Exception {
        List<Integer> list = initList();
        List<Integer> copyOnWriteArrayList = new CopyOnWriteArrayList<>(list);
        List<Integer> synchronizedList = Collections.synchronizedList(list);
        Vector vector = new Vector(list);

        int copyOnWriteArrayListTime = 0;
        int synchronizedListTime = 0;
        int vectorTime = 0;
        ExecutorService executor = Executors.newFixedThreadPool(THREAD_COUNT);
        CountDownLatch countDownLatch = new CountDownLatch(THREAD_COUNT);

        for (int i = 0; i < THREAD_COUNT; i++) {
            copyOnWriteArrayListTime += executor.submit(new GetTestTask(copyOnWriteArrayList, countDownLatch)).get();
        }
        System.out.println("CopyOnWriteArrayList get method cost time is " + copyOnWriteArrayListTime);

        for (int i = 0; i < THREAD_COUNT; i++) {
            synchronizedListTime += executor.submit(new GetTestTask(synchronizedList, countDownLatch)).get();
        }
        System.out.println("Collections.synchronizedList get method cost time is " + synchronizedListTime);

        for (int i = 0; i < THREAD_COUNT; i++) {
            vectorTime += executor.submit(new GetTestTask(vector, countDownLatch)).get();
        }
        System.out.println("vector get method cost time is " + vectorTime);
    }

    private List<Integer> initList() {
        List<Integer> list = new ArrayList<Integer>();
        for (int i = 0; i < SIZE; i++) {
            list.add(new Random().nextInt(1000));
        }
        return list;
    }
    
    class GetTestTask implements Callable<Integer> {
    List<Integer> list;
    CountDownLatch countDownLatch;

        GetTestTask(List<Integer> list, CountDownLatch countDownLatch) {
            this.list = list;
            this.countDownLatch = countDownLatch;
        }

        @Override
        public Integer call() {
            int pos = new Random().nextInt(SIZE);
            long start = System.currentTimeMillis();
            for (int i = 0; i < SIZE; i++) {
                list.get(pos);
            }
            long end = System.currentTimeMillis();
            countDownLatch.countDown();
            return (int) (end - start);
        }
    }
複製代碼

完整版代碼能夠點擊閱讀原文或公衆號內回覆文章編號010獲取

測試結果：

能夠看到隨着線程數的增長，三個類操做時間都有所增長，Vector的遍歷操做和CopyOnWriteArrayList的寫操做（圖片中標紅的部分）性能消耗尤爲嚴重。出乎意料的是Vector的讀寫操做和Collections.synchronizedList比起來並無什麼差異（印象中Vector性能不好，實際性能差的只是遍歷操做，看來仍是紙上得來終覺淺，絕知此事要躬行啊），仔細分析了下代碼，雖然Vector使用synchronized修飾方法，Collections.synchronizedList使用synchronized修飾語句塊，但實際鎖住內容並無什麼區別，性能類似也在情理之中。

總結

CopyOnWriteArrayList的寫操做與Vector的遍歷操做性能消耗尤爲嚴重，不推薦使用。
CopyOnWriteArrayList適用於讀操做遠遠多於寫操做的場景。
Vector讀寫性能能夠和Collections.synchronizedList比肩，但Collections.synchronizedList不只能夠包裝ArrayList,也能夠包裝其餘List,擴展性和兼容性更好。