【面試必備】透過源碼角度一步一步帶你分析 ArrayList 擴容機制

該文已加入開源文檔:JavaGuide(一份涵蓋大部分Java程序員所須要掌握的核心知識)。地址:github.com/Snailclimb/….java

一 先從 ArrayList 的構造函數提及

ArrayList有三種方式來初始化,構造方法源碼以下:git

/** * 默認初始容量大小 */
    private static final int DEFAULT_CAPACITY = 10;
    

    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

    /** *默認構造函數,使用初始容量10構造一個空列表(無參數構造) */
    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }
    
    /** * 帶初始容量參數的構造函數。(用戶本身指定容量) */
    public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {//初始容量大於0
            //建立initialCapacity大小的數組
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {//初始容量等於0
            //建立空數組
            this.elementData = EMPTY_ELEMENTDATA;
        } else {//初始容量小於0,拋出異常
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }


   /** *構造包含指定collection元素的列表,這些元素利用該集合的迭代器按順序返回 *若是指定的集合爲null,throws NullPointerException。 */
     public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }

複製代碼

細心的同窗必定會發現 :以無參數構造方法建立 ArrayList 時,實際上初始化賦值的是一個空數組。當真正對數組進行添加元素操做時,才真正分配容量。即向數組中添加第一個元素時,數組容量擴爲10。 下面在咱們分析 ArrayList 擴容時會降到這一點內容!程序員

二 一步一步分析 ArrayList 擴容機制

這裏以無參構造函數建立的 ArrayList 爲例分析github

1. 先來看 add 方法

/** * 將指定的元素追加到此列表的末尾。 */
    public boolean add(E e) {
   //添加元素以前,先調用ensureCapacityInternal方法
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        //這裏看到ArrayList添加元素的實質就至關於爲數組賦值
        elementData[size++] = e;
        return true;
    }
複製代碼

2. 再來看看 ensureCapacityInternal() 方法

能夠看到 add 方法 首先調用了ensureCapacityInternal(size + 1)數組

//獲得最小擴容量
    private void ensureCapacityInternal(int minCapacity) {
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
              // 獲取默認的容量和傳入參數的較大值
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }

        ensureExplicitCapacity(minCapacity);
    }
複製代碼

當 要 add 進第1個元素時,minCapacity爲1,在Math.max()方法比較後,minCapacity 爲10。bash

3. ensureExplicitCapacity() 方法

若是調用 ensureCapacityInternal() 方法就必定會進過(執行)這個方法,下面咱們來研究一下這個方法的源碼!ide

//判斷是否須要擴容
    private void ensureExplicitCapacity(int minCapacity) {
        modCount++;

        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            //調用grow方法進行擴容,調用此方法表明已經開始擴容了
            grow(minCapacity);
    }

複製代碼

咱們來仔細分析一下:函數

  • 當咱們要 add 進第1個元素到 ArrayList 時,elementData.length 爲0 (由於仍是一個空的 list),由於執行了 ensureCapacityInternal() 方法 ,因此 minCapacity 此時爲10。此時,minCapacity - elementData.length > 0成立,因此會進入 grow(minCapacity) 方法。
  • 當add第2個元素時,minCapacity 爲2,此時e lementData.length(容量)在添加第一個元素後擴容成 10 了。此時,minCapacity - elementData.length > 0 不成立,因此不會進入 (執行)grow(minCapacity) 方法。
  • 添加第三、4···到第10個元素時,依然不會執行grow方法,數組容量都爲10。

直到添加第11個元素,minCapacity(爲11)比elementData.length(爲10)要大。進入grow方法進行擴容。測試

4. grow() 方法

/** * 要分配的最大數組大小 */
    private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

    /** * ArrayList擴容的核心方法。 */
    private void grow(int minCapacity) {
        // oldCapacity爲舊容量,newCapacity爲新容量
        int oldCapacity = elementData.length;
        //將oldCapacity 右移一位,其效果至關於oldCapacity /2,
        //咱們知道位運算的速度遠遠快於整除運算,整句運算式的結果就是將新容量更新爲舊容量的1.5倍,
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        //而後檢查新容量是否大於最小須要容量,若仍是小於最小須要容量,那麼就把最小須要容量看成數組的新容量,
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
       // 若是新容量大於 MAX_ARRAY_SIZE,進入(執行) `hugeCapacity()` 方法來比較 minCapacity 和 MAX_ARRAY_SIZE,
       //若是minCapacity大於最大容量,則新容量則爲`Integer.MAX_VALUE`,不然,新容量大小則爲 MAX_ARRAY_SIZE 即爲 `Integer.MAX_VALUE - 8`。
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }
複製代碼

int newCapacity = oldCapacity + (oldCapacity >> 1),因此 ArrayList 每次擴容以後容量都會變爲原來的 1.5 倍! 記清楚了!不是網上不少人說的 1.5 倍+1!大數據

">>"(移位運算符):>>1 右移一位至關於除2,右移n位至關於除以 2 的 n 次方。這裏 oldCapacity 明顯右移了1位因此至關於oldCapacity /2。對於大數據的2進制運算,位移運算符比那些普通運算符的運算要快不少,由於程序僅僅移動一下而已,不去計算,這樣提升了效率,節省了資源  

咱們再來經過例子探究一下grow() 方法 :

  • 當add第1個元素時,oldCapacity 爲0,經比較後第一個if判斷成立,newCapacity = minCapacity(爲10)。可是第二個if判斷不會成立,即newCapacity 不比 MAX_ARRAY_SIZE大,則不會進入 hugeCapacity 方法。數組容量爲10,add方法中 return true,size增爲1。
  • 當add第11個元素進入grow方法時,newCapacity爲15,比minCapacity(爲11)大,第一個if判斷不成立。新容量沒有大於數組最大size,不會進入hugeCapacity方法。數組容量擴爲15,add方法中return true,size增爲11。
  • 以此類推······

這裏補充一點比較重要,可是容易被忽視掉的知識點:

  • java 中的 length屬性是針對數組說的,好比說你聲明瞭一個數組,想知道這個數組的長度則用到了 length 這個屬性.
  • java 中的 length() 方法是針對字符串說的,若是想看這個字符串的長度則用到 length() 這個方法.
  • java 中的 size() 方法是針對泛型集合說的,若是想看這個泛型有多少個元素,就調用此方法來查看!

5. hugeCapacity() 方法。

從上面 grow() 方法源碼咱們知道: 若是新容量大於 MAX_ARRAY_SIZE,進入(執行) hugeCapacity() 方法來比較 minCapacity 和 MAX_ARRAY_SIZE,若是minCapacity大於最大容量,則新容量則爲Integer.MAX_VALUE,不然,新容量大小則爲 MAX_ARRAY_SIZE 即爲 Integer.MAX_VALUE - 8

private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        //對minCapacity和MAX_ARRAY_SIZE進行比較
        //若minCapacity大,將Integer.MAX_VALUE做爲新數組的大小
        //若MAX_ARRAY_SIZE大,將MAX_ARRAY_SIZE做爲新數組的大小
        //MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }
複製代碼

System.arraycopy()Arrays.copyOf()方法

閱讀源碼的話,咱們就會發現 ArrayList 中大量調用了這兩個方法。好比:咱們上面講的擴容操做以及add(int index, E element)toArray() 等方法中都用到了該方法!

3.1 System.arraycopy() 方法

/** * 在此列表中的指定位置插入指定的元素。 *先調用 rangeCheckForAdd 對index進行界限檢查;而後調用 ensureCapacityInternal 方法保證capacity足夠大; *再將從index開始以後的全部成員後移一個位置;將element插入index位置;最後size加1。 */
    public void add(int index, E element) {
        rangeCheckForAdd(index);

        ensureCapacityInternal(size + 1);  // Increments modCount!!
        //arraycopy()方法實現數組本身複製本身
        //elementData:源數組;index:源數組中的起始位置;elementData:目標數組;index + 1:目標數組中的起始位置; size - index:要複製的數組元素的數量;
        System.arraycopy(elementData, index, elementData, index + 1, size - index);
        elementData[index] = element;
        size++;
    }
複製代碼

咱們寫一個簡單的方法測試如下:

public class ArraycopyTest {

	public static void main(String[] args) {
		// TODO Auto-generated method stub
		int[] a = new int[10];
		a[0] = 0;
		a[1] = 1;
		a[2] = 2;
		a[3] = 3;
		System.arraycopy(a, 2, a, 3, 3);
		a[2]=99;
		for (int i = 0; i < a.length; i++) {
			System.out.println(a[i]);
		}
	}

}
複製代碼

結果:

0 1 99 2 3 0 0 0 0 0 
複製代碼

3.2 Arrays.copyOf()方法

/** 以正確的順序返回一個包含此列表中全部元素的數組(從第一個到最後一個元素); 返回的數組的運行時類型是指定數組的運行時類型。 */
    public Object[] toArray() {
    //elementData:要複製的數組;size:要複製的長度
        return Arrays.copyOf(elementData, size);
    }
複製代碼

我的以爲使用 Arrays.copyOf()方法主要是爲了給原有數組擴容,測試代碼以下:

public class ArrayscopyOfTest {

	public static void main(String[] args) {
		int[] a = new int[3];
		a[0] = 0;
		a[1] = 1;
		a[2] = 2;
		int[] b = Arrays.copyOf(a, 10);
		System.out.println("b.length"+b.length);
	}
}
複製代碼

結果:

10
複製代碼

3.3 二者聯繫和區別

聯繫:

看二者源代碼能夠發現 copyOf() 內部實際調用了 System.arraycopy() 方法

區別:

arraycopy() 須要目標數組,將原數組拷貝到你本身定義的數組裏或者原數組,並且能夠選擇拷貝的起點和長度以及放入新數組中的位置 copyOf() 是系統自動在內部新建一個數組,並返回該數組。

ensureCapacity方法

ArrayList 源碼中有一個 ensureCapacity 方法不知道你們注意到沒有,這個方法 ArrayList 內部沒有被調用過,因此很顯然是提供給用戶調用的,那麼這個方法有什麼做用呢?

/** 若有必要,增長此 ArrayList 實例的容量,以確保它至少能夠容納由minimum capacity參數指定的元素數。 * * @param minCapacity 所需的最小容量 */
    public void ensureCapacity(int minCapacity) {
        int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA)
            // any size if not default element table
            ? 0
            // larger than default for default empty table. It's already
            // supposed to be at default size.
            : DEFAULT_CAPACITY;

        if (minCapacity > minExpand) {
            ensureExplicitCapacity(minCapacity);
        }
    }

複製代碼

最好在 add 大量元素以前用 ensureCapacity 方法,以減小增量重新分配的次數

咱們經過下面的代碼實際測試如下這個方法的效果:

public class EnsureCapacityTest {
	public static void main(String[] args) {
		ArrayList<Object> list = new ArrayList<Object>();
		final int N = 10000000;
		long startTime = System.currentTimeMillis();
		for (int i = 0; i < N; i++) {
			list.add(i);
		}
		long endTime = System.currentTimeMillis();
		System.out.println("使用ensureCapacity方法前:"+(endTime - startTime));

		list = new ArrayList<Object>();
		long startTime1 = System.currentTimeMillis();
		list.ensureCapacity(N);
		for (int i = 0; i < N; i++) {
			list.add(i);
		}
		long endTime1 = System.currentTimeMillis();
		System.out.println("使用ensureCapacity方法後:"+(endTime1 - startTime1));
	}
}
複製代碼

運行結果:

使用ensureCapacity方法前:4637
使用ensureCapacity方法前:241

複製代碼

經過運行結果,咱們能夠很明顯的看出向 ArrayList 添加大量元素以前最好先使用ensureCapacity 方法,以減小增量重新分配的次數

相關文章
相關標籤/搜索