ArrayList是集合的一種實現,實現了接口List,List接口繼承了Collection接口。Collection是全部集合類的父類。ArrayList使用很是普遍,不管是數據庫表查詢,excel導入解析,仍是網站數據爬取都須要使用到,瞭解ArrayList原理及使用方法顯得很是重要。java
//默認建立一個ArrayList集合 List<String> list = new ArrayList<>(); //建立一個初始化長度爲100的ArrayList集合 List<String> initlist = new ArrayList<>(100); //將其餘類型的集合轉爲ArrayList List<String> setList = new ArrayList<>(new HashSet());
咱們讀一下源碼,看看定義ArrayList的過程到底作了什麼?數據庫
public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable { /** * Default initial capacity. */ private static final int DEFAULT_CAPACITY = 10; /** * Shared empty array instance used for empty instances. */ private static final Object[] EMPTY_ELEMENTDATA = {}; /** * Shared empty array instance used for default sized empty instances. We * distinguish this from EMPTY_ELEMENTDATA to know how much to inflate when * first element is added. */ private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {}; /** * The array buffer into which the elements of the ArrayList are stored. * The capacity of the ArrayList is the length of this array buffer. Any * empty ArrayList with elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA * will be expanded to DEFAULT_CAPACITY when the first element is added. */ transient Object[] elementData; // non-private to simplify nested class access /** * The size of the ArrayList (the number of elements it contains). * * @serial */ private int size; /** * Constructs an empty list with the specified initial capacity. * * @param initialCapacity the initial capacity of the list * @throws IllegalArgumentException if the specified initial capacity * is negative */ public ArrayList(int initialCapacity) { if (initialCapacity > 0) { this.elementData = new Object[initialCapacity]; } else if (initialCapacity == 0) { this.elementData = EMPTY_ELEMENTDATA; } else { throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity); } } /** * Constructs an empty list with an initial capacity of ten. */ public ArrayList() { this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA; } /** * Constructs a list containing the elements of the specified * collection, in the order they are returned by the collection's * iterator. * * @param c the collection whose elements are to be placed into this list * @throws NullPointerException if the specified collection is null */ public ArrayList(Collection<? extends E> c) { elementData = c.toArray(); if ((size = elementData.length) != 0) { // c.toArray might (incorrectly) not return Object[] (see 6260652) if (elementData.getClass() != Object[].class) elementData = Arrays.copyOf(elementData, size, Object[].class); } else { // replace with empty array. this.elementData = EMPTY_ELEMENTDATA; } } }
其實源碼裏面已經很清晰了,ArrayList非線程安全,底層是一個Object[],添加到ArrayList中的數據保存在了elementData屬性中。數組
當調用new ArrayList<>()
時,將一個空數組{}賦值給了elementData,這個時候集合的長度size爲默認長度0;安全
當調用new ArrayList<>(100)
時,根據傳入的長度,new一個Object[100]賦值給elementData,固然若是玩兒的話,傳了一個0,那麼將一個空數組{}賦值給了elementData;dom
當調用new ArrayList<>(new HashSet())時,根據源碼,咱們可知,能夠傳遞任何實現了Collection接口的類,將傳遞的集合調用toArray()方法轉爲數組內賦值給elementData;ide
注意:在傳入集合的ArrayList的構造方法中,有這樣一個判斷網站
if (elementData.getClass() != Object[].class),ui
給出的註釋是:c.toArray might (incorrectly) not return Object[] (see 6260652),即調用toArray方法返回的不必定是Object[]類型,查看ArrayList源碼this
public Object[] toArray() { return Arrays.copyOf(elementData, size);}咱們發現返回的確實是Object[],那麼爲何還會有這樣的判斷呢?線程
若是有一個類CustomList繼承了ArrayList,而後重寫了toArray()方法呢。。
public class CustomList<E> extends ArrayList { @Override public Integer [] toArray() { return new Integer[]{1,2}; }; public static void main(String[] args) { Object[] elementData = new CustomList<Integer>().toArray(); System.out.println(elementData.getClass()); System.out.println(Object[].class); System.out.println(elementData.getClass() == Object[].class); } }
執行結果:
class [Ljava.lang.Integer; class [Ljava.lang.Object; false
接着說,若是傳入的集合類型和咱們定義用來保存添加到集合中值的Object[]類型不一致時,ArrayList作了什麼處理?讀源碼看到,調用了Arrays.copyOf(elementData, size, Object[].class);
,繼續往下走
public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) { T[] copy = ((Object)newType == (Object)Object[].class) ? (T[]) new Object[newLength] : (T[]) Array.newInstance(newType.getComponentType(), newLength); System.arraycopy(original, 0, copy, 0, Math.min(original.length, newLength)); return copy; }
咱們發現定義了一個新的數組,將原數組的數據拷貝到了新的數組中去。
ArrayList有不少經常使用方法,add,addAll,set,get,remove,size,isEmpty等
首先定義了一個ArrayList,
List<String> list = new ArrayList<>(10); list.add('牛魔王'); list.add('蛟魔王'); ... list.add('美猴王');
Object[] elementData中數據以下:
咱們經過源碼來看一下add("白骨精")到底發生了什麼
public boolean add(E e) { ensureCapacityInternal(size + 1); // Increments modCount!! elementData[size++] = e; return true; }
首先經過 ensureCapacityInternal(size + 1)
來保證底層Object[]數組有足夠的空間存放添加的數據,而後將添加的數據存放到數組對應的位置上,咱們看一下是怎麼保證數組有足夠的空間?
private void ensureCapacityInternal(int minCapacity) { if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) { minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity); } ensureExplicitCapacity(minCapacity); }
private void ensureExplicitCapacity(int minCapacity) { modCount++; // overflow-conscious code if (minCapacity - elementData.length > 0) grow(minCapacity); }
這裏首先肯定了Object[]足夠存放添加數據的最小容量,而後經過 grow(int minCapacity)
來進行數組擴容
private void grow(int minCapacity) { // overflow-conscious code int oldCapacity = elementData.length; int newCapacity = oldCapacity + (oldCapacity >> 1); if (newCapacity - minCapacity < 0) newCapacity = minCapacity; if (newCapacity - MAX_ARRAY_SIZE > 0) newCapacity = hugeCapacity(minCapacity); // minCapacity is usually close to size, so this is a win: elementData = Arrays.copyOf(elementData, newCapacity); }
擴容規則爲「數組當前足夠的最小容量 + (數組當前足夠的最小容量 / 2)」,即數組當前足夠的最小容量 * 1.5,固然有最大值的限制。
由於最開始定義了集合容量爲10,故而本次不會進行擴容,直接將第8個位置(從0開始,下標爲7)設置爲「白骨精」,這時Object[] elementData中數據以下:
還有和add()相似的方法。空間擴容原理都是同樣,如:
add("鐵扇", 0);
//將數組中的元素各自日後移動一位,再將「鐵扇」放到第一個位置上;
addAll(list..七個葫蘆娃);
//將集合{七個葫蘆娃}放到"白骨精"後,很明顯當前數組的容量已經不夠,須要擴容了,不執行該句代碼了;
addAll(list..哪吒三兄弟, 4);
//從第五個位置將「哪吒三兄弟」插進去,那麼數組第五個位置後的元素都需日後移動三位,數組按規則擴容爲18。指定了插入位置的,會經過rangeCheckForAdd(int index)方法判斷是否數組越界
由於ArrayList底層是由數組實現的,set實現很是簡單,調用 set(8, "豬八戒")
經過傳入的數字下標找到對應的位置,替換其中的元素,前提也須要首先判斷傳入的數組下標是否越界。將「獼猴王」替換爲「豬八戒」。
public E set(int index, E element) { rangeCheck(index); E oldValue = elementData(index); elementData[index] = element; return oldValue; }
//返回值「獼猴王」,當前數組中數據:
ArrayList中get方法也很是簡單,經過下標查找便可,同時須要進行了類型轉換,由於數組爲Object[],前提是須要判斷傳入的數組下標是否越界。
public E get(int index) { rangeCheck(index); return elementData(index); } E elementData(int index) { return (E) elementData[index]; }
調用get(6)返回」哪吒「。
首先說一下ArrayList經過下標刪除的方法,咱們看一下源碼
public E remove(int index) { rangeCheck(index); modCount++; E oldValue = elementData(index); int numMoved = size - index - 1; if (numMoved > 0) System.arraycopy(elementData, index+1, elementData, index, numMoved); elementData[--size] = null; // clear to let GC do its work return oldValue; }
經過源碼咱們能夠看到首先獲取了待刪除的元素,並最終返回了。其次計算了數組中須要移動的位數 size - index - 1,那麼很明顯咱們能夠得出待刪除的是最後一個元素的話,移到位數爲0,不然移動位數大於0,那麼經過數組元素的拷貝來實現往前移動相應位數。
如remove(10),找到的元素爲「美猴王」,那麼移動位數 = 12-10-1 = 1;此時將本來在第12個位置上(數組下標爲11)的「白骨精」往前移動一位,同時設置elementData[11] = null;這裏經過設置null值讓GC起做用。
刪除ArrayList中的值對象,其實和經過下標刪除很類似,只是多了一個步驟,遍歷底層數組elementData,經過equals()方法或 == (特殊狀況下)來找到要刪除的元素,獲取其下標,調用remove(int index)同樣的代碼便可。
public boolean remove(Object o) { if (o == null) { for (int index = 0; index < size; index++) if (elementData[index] == null) { fastRemove(index); return true; } } else { for (int index = 0; index < size; index++) if (o.equals(elementData[index])) { fastRemove(index); return true; } } return false; }
size() : 獲取集合長度,經過定義在ArrayList中的私有變量size獲得
isEmpty():是否爲空,經過定義在ArrayList中的私有變量size獲得
contains(Object o):是否包含某個元素,經過遍歷底層數組elementData,經過equals或==進行判斷
clear():集合清空,經過遍歷底層數組elementData,設置爲null
本文主要講解了ArrayList原理,從底層數組着手,講解了ArrayList定義時到底發生了什麼,再添加元素時,擴容規則如何,刪除元素時,數組的元素的移動方式以及一些經常使用方法的用途,如有不對之處,請批評指正,望共同進步,謝謝!