ArrayList是最常使用的集合類之一了。在JDK文檔中對ArrayList
的描述是:ArrayList
是對list
接口的一種基於可變數組的實現。ArrayList類的聲明以下:java
1 |
public class ArrayList<E> extends AbstractList<E> |
ArrayList繼承了AbstractList抽象類,並實現了List,RandomAccess,Cloneable以及Serializable接口。對 RandomAccess 接口的實現代表支持隨機訪問(由於基於數組嘛~),同Cloneable接口和Serializable接口同樣,該接口只是一個標記,不須要實現任何方法。ArrayList 能夠支持值爲 null 的元素。數組
本文中的分析都是針對JDK8中的源碼進行的。安全
從文檔中的說明能夠知道,ArrayList的底層是基於數組來實現的。那咱們就先來看一下ArrayList
的成員變量:app
1 |
private static final long serialVersionUID = 8683452581122892189L; |
使用了一個 Object 數組來存放數據,並維護一個計對數器來記錄當前容器中元素的數量。注意到數組 elementData 是使用 transient 來修飾的,在後面會此進行進行解釋。框架
除此之外,在 ArrayList 還有一個繼承自父類 AbstractList
的成員變量 modCount 須要關注。使用 modCount 記錄列表發生結構化修改的次數,從而提供 fail-fast 的迭代器。由於 ArrayList 的實現是非同步的,若是在迭代過程當中另外一個線程向同一個容器中添加元素或移除元素,就會致使ConcurrentModificationExceptions
。dom
1 |
//The number of times this list has been structurally modified. |
1 |
/** |
ArrayList 類提供了三個構造方法,如上所示。除了初始化一個空的ArrayList之外,還支持使用另一個容器中的元素來初始化ArrayList。注意到,在初始化一個空的ArrayList時,若是不指定容量的大小,默認容量是10。在初始化一個空的ArrayList時,若是指定容量爲0,則數組引用指向的是一個靜態成員變量EMPTY_ELEMENTDATA;若是使用默認容量,則數組引用指向的是一個靜態成員變量DEFAULTCAPACITY_EMPTY_ELEMENTDATA;除此之外,按照實際指定的容量分配數組空間。ide
ArrayList既然是基於可變數組的,那麼在底層數組的存儲容量不足時確定會進行擴容操做,以改變容器的容量。擴容的操做是經過下面的代碼進行實現的:源碼分析
1 |
/** |
這一段代碼的註釋很清楚了,大體解釋一下:ensureCapacity
方法可供外部調用,而ensureCapacityInternal
則僅供內部調用,都是要確保當前容器可以容納給定數量的元素,它們都會調用ensureExplicitCapacity
方法;在每次調用ensureExplicitCapacity
方法時,會將modCount
的值加1,代表 ArrayList 發生告終構化的修改,而後根據當前數組能容納的元素數量來決定是否須要調用grow
方法來調整數組的大小;grow
方法負責調整數組的大小,注意每次調整時將容量擴大爲當前容量的1.5倍(oldCapacity + (oldCapacity >> 1)
),若是仍是不能知足容量要求,就按照所需的最小容量來分配,而後將原數組中的元素複製到新數組中。ArrayList 可以支持的最大容量爲 int 值的上限,超過會報OutOfMemoryError
異常。優化
這裏有一個奇怪的地方在於,modCount 的值會在 ensureExplicitCapacity
方法中加1。前面已經說過,modCount用來記錄容器發生結構化修改的次數,按道理來講實在加入或移除元素是纔會修改的,爲何會在這裏調用呢。後面咱們會看到,每次新加入元素時,ensureExplicitCapacity
都會被調用,於是能夠將modCount的修改放在此方法中,就沒必要在 add
及 addAll
方法中進行修改了。ui
1 |
/** |
能夠向ArrayList容器中添加單個元素,也能夠添加一個容器;默認添加到數組的末尾,也能夠添加到指定位置。首先會確認當前容量是否充裕,若是不足則會進行擴容操做。每次添加元素時都會修改modCount的值,前面已經詳細地說明過了。在指定添加的位置時,會先檢查指定的位置是否合理,不合理則會拋出IndexOutOfBoundsException
;若是插入位置合理,則會將相應位置後面的元素向後挪以騰出空間,而後將待添加的元素放入。
1 |
/** |
移除元素時其實就是使用System.arraycopy
將移除後仍保留的元素複製到正確的位置上,並調整當前的size大小。注意,在元素移動完成後,要顯式地將數組中再也不使用的位置中存放的值賦爲null,從而確保GC可以正常地回收資源。
下面再看看如何作到從ArrayList中移除指定容器內的元素以及保留指定容器中的元素。
1 |
/** |
咱們能夠看到,核心的方法在於batchRemove(Collection<?> c, boolean complement)
,不管是移除給定容器中的元素removeAll(Collection<?> c)
仍是隻保留指定容器中的元素retainAll(Collection<?> c)
都是經過該方法來實現的。該方法經過傳入的一個布爾類型肯定ArrayList中每一個元素是否應該保留,詳細的註釋參見上面代碼中的中文註釋。
上面從ArrayList中移除元素的全部方法中都沒有對移除元素後的數組大小進行調整,這種狀況下可能會在移除大量元素後形成空間的浪費。這時候能夠經過trimToSize
方法將數組大小調整爲實際的大小。
1 |
/** |
1 |
|
基於數組的實現使得更新元素及查找元素變得比較簡單。在set方法中不會修改modCount的值。
在AbstractList中其實已經提供了迭代器的一個實現,ArrayList類中又提供了一個優化後的實現。
1 |
/** |
迭代器中經過一個遊標cursor來達到遍歷全部元素的目的,同時還保留了上一個訪問的位置以便於remove方法的實現。前面說過,ArrayList的實現並非線程安全,其fail-fast機制的實現是經過modCount變量來實現的。在這裏咱們能夠清楚地看到,在迭代器的next和remove等方法中,首先就會調用checkForComodification
方法來判斷ArrayList容器是否在迭代器建立後發生過結構上的修改,其具體的實現是經過比較建立迭代器時的modCount(即expectedModCount)和當前modCount是否相同來完成的。若是不相同,代表在此過程當中其餘線程修改了ArrayList(添加了或移除了元素),會拋出ConcurrentModificationException
異常。
List接口還支持另外一種迭代器,ListIterator<E>
,不只可使用next()方法向前迭代,還可使用previous()方法向後移動遊標。ArrayList中也實現了listIterator()
和listIterator(int index)
方法,比較簡單,這裏就再也不詳細說了。
所謂的子列表,就是列表中指定範圍內的一些元素,經過調用subList(int fromIndex, int toIndex)
來獲取。對子列表的操做會影響到父列表。經過子列表能夠達到操做父列表中部分元素的目的,如只迭代部分範圍內的元素,或者只對部分範圍內的元素進行排序。
1 |
private class SubList extends AbstractList<E> implements RandomAccess { |
上面列出了ArrayList中使用的子列表的部分代碼,SubList繼承了AbstractList,並實現了RandomAccess接口。SubList中並無向ArrayList那樣有一個數組來存放元素,而是持有了父列表的引用,並保存了元素相對於父列表的偏移及範圍等信息。對子列表的全部操做都是經過父列表來完成的。值得說明的是,由於SubList也是AbstractList的子類,於是也有一個modCount字段。在建立子列表時,modCount和父列表一致;之後每當經過子列表修改父列表時也都會保持一致。在調用子列表的方法時,相似於迭代器,首先也會經過checkForComodification
方法確保父列表的結構沒有發生改變,不然會拋出ConcurrentModificationException
異常。
前面提到過數組 elementData 是使用 transient 來修飾的,這個其實就和序列化及反序列化相關。transient 是一個關鍵字,用 transient 修飾的變量再也不是對象持久化的一部分,即默認序列化機制中該變量不用被序列化。
這一點可能讓人很費解,若是不用被序列化,那麼反序列化的時候不是就丟失了存儲的數據了嗎?實際上,在 ArrayList 中對序列化和反序列化過程進行了更細緻的控制,即經過 writeObject()
和 readObject()
方法。
1 |
/** |
可見,在序列化時並非將整個數組所有寫入輸出流中,由於數組一般都不是處於徹底填充的狀態,對於爲 null 的元素就沒必要保存,也能夠達到節約空間的目的。後面咱們會看到不少集合類中都採起了這種方式進行序列化和反序列化。
本文經過源碼分析了Java 8 集合框架中ArrayList的實現方式。ArrayList內部是經過數組進行實現的,具備高效的隨機訪問的特性;但插入和刪除元素時每每須要複製數組,開銷較大。在容器建立完成後須要進行大量訪問,但插入和刪除操做使用較少的狀況下比較適合使用ArrayList。