Android中須要瞭解的數據結構(一)

Java容器類

Java容器類是java提供的工具包,包含了經常使用的數據結構:集合、鏈表、隊列、棧、數組、映射等。
Java容器主要能夠劃分爲4個部分:List列表、Set集合、Map映射、工具類(Iterator迭代器、Enumeration枚舉類、Arrays和Collections)java

經過上圖,能夠把握兩個基本主體,即Collection和Map。node

  • Colletcion是一個接口,是高度抽象出來的集合,它包含了集合的基本操做和屬性。Collection包含了List和Set兩大分支。
  • List是一個有序的隊列,每個元素都有它的索引。第一個元素的索引值是0。List的實現類有LinkedList, ArrayList, Vector, Stack。
  • Set是一個不容許有重複元素的集合。 Set的實現類有HastSet和TreeSet。HashSet依賴於HashMap,它其實是經過HashMap實現的;TreeSet依賴於TreeMap,它其實是經過TreeMap實現的。
  • Map是一個映射接口,即key-value鍵值對。Map中的每個元素包含「一個key」和「key對應的value」。 AbstractMap是一個抽象類,它實現了Map中大部分的API。而HashMap,TreeMap,WeakHashMap都是繼承AbstractMap。Hashtable雖然繼承Dictionary,可是實現的Map接口。
  • Iterator是遍歷集合的工具,即咱們一般經過Iterator迭代器來遍歷集合。咱們說Collection依賴於Iterator,是由於Collection的實現類都要實現iterator()函數,返回一個Iterator對象。ListIterator是專門爲遍歷List而存在的。
  • Arrays和Collections是操做數組、集合的兩個工具類。

Collection接口

public interface Collection<E> extends Iterable<E> {}
複製代碼

它是一個接口,是高度抽象出來的集合,它包含了集合的基本操做:添加、刪除、清空、遍歷(讀取)、是否爲空、獲取大小、是否保護某元素等等。
在Java中全部實現了Collection接口的類都必須提供兩套標準的構造函數,一個是無參,用於建立一個空的Collection,一個是帶有Collection參數的有參構造函數,用於建立一個新的Collection,這個新的Collection與傳入進來的Collection具有相同的元素。
例如ArrayList:數組

public ArrayList() {
        throw new RuntimeException("Stub!");
    }

    public ArrayList(Collection<? extends E> c) {
        throw new RuntimeException("Stub!");
    }
複製代碼

List接口

public interface List<E> extends Collection<E> {} List是一個繼承於Collection的接口,List是集合的一種。List是有序的隊列,List中每個元素都有一個索引;第一個元素索引值是0,日後就依次+1,List中容許有重複的元素。 既然List是繼承於Collection接口,它天然就包含了Collection中的所有函數接口;因爲List是有序隊列,它也額外的有本身的API接口。主要有「添加、刪除、獲取、修改指定位置的元素」、「獲取List中的子隊列」等。安全

// Collection的API
    abstract boolean         add(E object)
    abstract boolean         addAll(Collection<? extends E> collection)
    abstract void            clear()
    abstract boolean         contains(Object object)
    abstract boolean         containsAll(Collection<?> collection)
    abstract boolean         equals(Object object)
    abstract int             hashCode()
    abstract boolean         isEmpty()
    abstract Iterator<E>     iterator()
    abstract boolean         remove(Object object)
    abstract boolean         removeAll(Collection<?> collection)
    abstract boolean         retainAll(Collection<?> collection)
    abstract int             size()
    abstract <T> T[]         toArray(T[] array)
    abstract Object[]        toArray()
    // 相比與Collection,List新增的API:
    abstract void                add(int location, E object)
    abstract boolean             addAll(int location, Collection<? extends E> collection)
    abstract E                   get(int location)
    abstract int                 indexOf(Object object)
    abstract int                 lastIndexOf(Object object)
    abstract ListIterator<E>     listIterator(int location)
    abstract ListIterator<E>     listIterator()
    abstract E                   remove(int location)
    abstract E                   set(int location, E object)
    abstract List<E>             subList(int start, int end)
複製代碼

實現List接口的集合主要有:ArrayList、LinkedList、Vector、Stack。bash

ArrayList

public class ArrayList<E> extends AbstractList<E> implements List<E>,
    RandomAccess, Cloneable, Serializable {}
複製代碼

ArrayList 是一個數組隊列,至關於動態數組。與Java中的數組相比,它的容量能動態增加。它繼承於AbstractList,實現了List, RandomAccess, Cloneable, java.io.Serializable這些接口。數據結構

  • RandmoAccess爲List提供快速訪問功能。在ArrayList中,咱們便可以經過元素的序號快速獲取元素對象,這就是快速隨機訪問。
  • ArrayList中的操做不是線程安全的,因此爲了防止意外的非同步訪問,最好在建立時聲明:List list = Collections.synchronizedList(new ArrayList(...));

ArrayList有七個字段加一個定義在AbstractList的modCount:多線程

private static final long serialVersionUID = 8683452581122892189L;
    private static final int DEFAULT_CAPACITY = 10;
  
    private static final Object[] EMPTY_ELEMENTDATA = {};
    
    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
    
    // Android-note: Also accessed from java.util.Collections
    transient Object[] elementData; // non-private to simplify nested class access
    
    private int size;
    /**
     * The maximum size of array to allocate.
     * Some VMs reserve some header words in an array.
     * Attempts to allocate larger arrays may result in
     * OutOfMemoryError: Requested array size exceeds VM limit
     */
    private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
    
    protected transient int modCount = 0;
複製代碼

ArrayList的默認容量DEFAULT_CAPACITY爲10,EMPTY_ELEMENTDATADEFAULTCAPACITY_EMPTY_ELEMENTDATA是兩個常量。dom

// 默認構造函數
    public ArrayList() {
            this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
        }
    // initialCapacity是ArrayList的默認容量大小。當因爲增長數據致使容量不足時,容量會添加上一次容量大小的一半。
    public ArrayList(int initialCapacity) {
            if (initialCapacity > 0) {
                this.elementData = new Object[initialCapacity];
            } else if (initialCapacity == 0) {
                this.elementData = EMPTY_ELEMENTDATA;
            } else {
                throw new IllegalArgumentException("Illegal Capacity: "+initialCapacity);
            }
        }
    // 建立一個包含collection的ArrayList
    public ArrayList(Collection<? extends E> c) {
            elementData = c.toArray();
            if ((size = elementData.length) != 0) {
                // c.toArray might (incorrectly) not return Object[] (see 6260652)
                if (elementData.getClass() != Object[].class)
                    elementData = Arrays.copyOf(elementData, size, Object[].class);
            } else {
                // replace with empty array.
                this.elementData = EMPTY_ELEMENTDATA;
            }
        }
複製代碼

當使用有參構造函數,而且initialCapacity爲0或者Colletion中沒有元素的時候,返回的就是EMPTY_ELEMENTDATA。當使用默認構造函數publicArrayList(),返回DEFAULTCAPACITY_EMPTY_ELEMENTDATA。 這兩個數組都是空的並不會存放值。當第一次往ArrayList添加元素的時候,實際上是將元素存放到elementData中,因此真正用來存放元素的是elementData。
add方法:函數

public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }
   
    public void add(int index, E element) {
        if (index > size || index < 0)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));

        ensureCapacityInternal(size + 1);  // Increments modCount!!
        System.arraycopy(elementData, index, elementData, index + 1,
                         size - index);
        elementData[index] = element;
        size++;
    }
    public boolean addAll(Collection<? extends E> c) {
        Object[] a = c.toArray();
        int numNew = a.length;
        ensureCapacityInternal(size + numNew);  // Increments modCount
        System.arraycopy(a, 0, elementData, size, numNew);
        size += numNew;
        return numNew != 0;
    }
    public boolean addAll(int index, Collection<? extends E> c) {
        rangeCheckForAdd(index); //判斷索引位置是否正確
        Object[] a = c.toArray();
        int numNew = a.length;
        ensureCapacityInternal(size + numNew);  // Increments modCount
         //將ArrayList容器從index開始的全部元素向右移動到index+numNew的位置,從而騰出numNew長度的空間放c
        int numMoved = size - index;
        if (numMoved > 0)
            System.arraycopy(elementData, index, elementData, index + numNew,numMoved);
        System.arraycopy(a, 0, elementData, index, numNew);
        size += numNew;
        return numNew != 0;
    }
複製代碼

add(E e)將元素直接添加到列表的尾部。另外3種經過System.arraycopy() 將數組進行拷貝。
add(int index, E element)經過將index的位置空出來,進行數組數據的右移,這是很是麻煩和耗時的,因此若是指定的數據集合須要進行大量插入(中間插入)操做,須要考慮性能的消耗。
addAll(Collection<? extends E> c)按照指定 collection 的迭代器返回的元素順序,將該 collection 中的全部元素添加到此列表的尾部。
addAll(int index, Collection<? extends E> c)從指定的位置開始,將指定 collection 中的全部元素插入到此列表中。
remove方法:工具

public E remove(int index) {
        rangeCheck(index);
        modCount++;
        E oldValue = elementData(index);
        //向左移的位數,下標從0開始,須要再多減1
        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        //置空最後一個元素                     
        elementData[--size] = null; // clear to let GC do its work
        return oldValue;
    }
    public boolean remove(Object o) {
        if (o == null) {
            for (int index = 0; index < size; index++)
                if (elementData[index] == null) {
                    fastRemove(index);
                    return true;
                }
        } else {
            for (int index = 0; index < size; index++)
                if (o.equals(elementData[index])) {
                    //fastRemove()方法用於移除指定位置的元素,和remove方法相似,區別是void類型
                    fastRemove(index);
                    return true;
                }
        }
        return false;
    }
    protected void removeRange(int fromIndex, int toIndex) {
        modCount++;
        int numMoved = size - toIndex;
        System.arraycopy(elementData, toIndex, elementData, fromIndex,numMoved);
        // clear to let GC do its work
        int newSize = size - (toIndex-fromIndex);
        for (int i = newSize; i < size; i++) {
            elementData[i] = null;
        }
        size = newSize;
    }
    public boolean removeAll(Collection<?> c) {
        //Checks that the specified object reference is not null
        Objects.requireNonNull(c);
        //false是移除相同元素,方法retainAll中置爲true,是保留相同元素
        return batchRemove(c, false);
    }
    
    private boolean batchRemove(Collection<?> c, boolean complement) {
        final Object[] elementData = this.elementData;
        int r = 0, w = 0;
        boolean modified = false;
        try {
            for (; r < size; r++)
                if (c.contains(elementData[r]) == complement)
                    elementData[w++] = elementData[r];
        } finally {
            // Preserve behavioral compatibility with AbstractCollection,
            // even if c.contains() throws.
            if (r != size) {
                System.arraycopy(elementData, r, elementData, w, size - r);
                w += size - r;
            }
            if (w != size) {
                // clear to let GC do its work
                for (int i = w; i < size; i++)
                    elementData[i] = null;
                modCount += size - w;
                size = w;
                modified = true;
            }
        }
        return modified;
    }
複製代碼

擴容

public void ensureCapacity(int minCapacity) {
        int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA)
            ? 0: DEFAULT_CAPACITY;
        if (minCapacity > minExpand) {
            ensureExplicitCapacity(minCapacity);
        }
    }

    private void ensureCapacityInternal(int minCapacity) {
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }

        ensureExplicitCapacity(minCapacity);
    }

    private void ensureExplicitCapacity(int minCapacity) {
        modCount++;

        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }
    private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }    
複製代碼

ArrayList每次新增元素時都會須要進行容量檢測判斷,若新增元素後元素的個數會超過ArrayList的容量,就會進行擴容操做來知足新增元素的需求。因此當咱們清楚知道業務數據量或者須要插入大量元素前,可使用ensureCapacity來手動增長ArrayList實例的容量,以減小遞增式再分配的數量。

迭代效率

public static void loopOfFor(List<Integer> list){
        int value;
        int size = list.size();
        // 基本的for
        for (int i = 0; i < size; i++)
        {
            value = list.get(i);
        }
    }
    /**
     * 使用forecah方法遍歷數組
     * @param list
     */
    public static void loopOfForeach(List<Integer> list){
        int value;
        // foreach
        for (Integer integer : list)
        {
            value = integer;
        }
    }
    /**
     * 經過迭代器方式遍歷數組
     * @param list
     */
    public static void loopOfIterator(List<Integer> list){
        int value;
        // iterator
        for (Iterator<Integer> iterator = list.iterator(); iterator.hasNext();)
        {
            value = iterator.next();            
        }
    }
複製代碼

在遍歷ArrayList中,效率最高的是loopOfFor,loopOfForeach和loopOfIterator之間關係不明確,但在增大運行次數時,loopOfIterator效率高於loopOfForeach。

LinkedList

public class LinkedList<E> extends AbstractSequentialList<E> implements List<E>, 
    Deque<E>, Cloneable, Serializable {}
複製代碼

LinkedList繼承於AbstractSequentialList,實現了List, Deque, Cloneable, java.io.Serializable這些接口。
AbstractSequentialList繼承AbstractList,在功能上,最大限度地減小了實現受「連續訪問」數據存儲所需的工做。
簡單的說是你的列表須要快速的添加刪除數據等,用此抽象類,如果須要快速隨機的訪問數據等用AbstractList抽象類。

同ArrayList同樣,LinkedList中的操做不是線程安全的,因此爲了防止意外的非同步訪問,最好在建立時聲明: List list = Collections.synchronizedList(new LinkedList(...));

LinkedList實現了一個雙向列表,由first字段和last字段指向列表的頭部和尾部。列表的每一個節點是一個Node對象。

private static class Node<E> {
        E item;
        Node<E> next;
        Node<E> prev;
        Node(Node<E> prev, E element, Node<E> next) {
            this.item = element;
            this.next = next;
            this.prev = prev;
        }
    }
複製代碼
// 默認構造函數:建立一個空的鏈表
      public LinkedList() {
        header.next = header.previous = header;
      }
  
      // 包含「集合」的構造函數:建立一個包含「集合」的LinkedList
      public LinkedList(Collection<? extends E> c) {
          this();
          addAll(c);
      }
      
      public boolean addAll(Collection<? extends E> c) {
        return addAll(size, c);
     }
     public boolean addAll(int index, Collection<? extends E> c) {
        //若插入的位置小於0或者大於鏈表長度,則拋出IndexOutOfBoundsException異常
        checkPositionIndex(index);
        
        Object[] a = c.toArray();
        int numNew = a.length;//插入元素個數
        if (numNew == 0)
            return false;
        Node<E> pred, succ;     //定義前導與後繼
        if (index == size) {    //若是在隊尾插入
            succ = null;    //後繼置空
            pred = last;    //前導指向隊尾元素last
        } else {            //在指定位置插入
            succ = node(index); //後繼指向該位置
            pred = succ.prev;   //先導指向前一個元素
        }
        for (Object o : a) {
            @SuppressWarnings("unchecked") E e = (E) o;
            Node<E> newNode = new Node<>(pred, e, null);//建立一個新節點,指定先導,後繼置空
            if (pred == null)//若是先導不存在
                first = newNode;//表頭first指向此節點
            else
                pred.next = newNode;//先導存在,則將其next指向新節點
            pred = newNode;//先導移動,繼續建立新節點
        }
        if (succ == null) {
            last = pred;
        } else {
            pred.next = succ;
            succ.prev = pred;
        }
        size += numNew;
        modCount++;
        return true;
    }

複製代碼

LinkedList提供了一系列API用於插入和刪除元素。 例linkFirst(),linkLast(),linkBefore(), unlinkFirst(),unlinkLast(),unlink()
在get、set、add、remove方法中都用到了一個 node方法,它將輸入的index與鏈表長度的1/2進行對比,小於則從first開始操做,不然從last開始操做,節省通常的查找時間。

/**
     * Returns the (non-null) Node at the specified element index.
     */
    Node<E> node(int index) {
        // assert isElementIndex(index);

        if (index < (size >> 1)) {
            Node<E> x = first;
            for (int i = 0; i < index; i++)
                x = x.next;
            return x;
        } else {
            Node<E> x = last;
            for (int i = size - 1; i > index; i--)
                x = x.prev;
            return x;
        }
    }
複製代碼

LinkedList經過代價較低在List中間進行插入和移除,提供了優化的順序訪問,可是在隨機訪問方面相對較慢。

上面都提到了ArrayList、LinkedList都是非線程安全的,面對多線程對操做時,可能會產生的fail-fast事件,拋出異常java.util.ConcurrentModificationException。而ConcurrentModificationException是在操做Iterator時拋出的異常。Iterator裏定義了一個叫expectedModCount的變量,初始化等於modCount的值。從ArrayList源碼能夠看到各類操做都會修改modCount的值。 解決方案用CopyOnWriteArrayList代替ArrayList

//CopyOnWriteArrayList
     public boolean add(E e) {
        final ReentrantLock lock = this.lock;
        lock.lock();
        try {
            Object[] elements = getArray(); //copy一份原來的array
            int len = elements.length;
            Object[] newElements = Arrays.copyOf(elements, len + 1); 
            newElements[len] = e; //在copy的數組上add
            setArray(newElements); //原有引用指向修改後的數據
            return true;
        } finally {
            lock.unlock();
        }
     }
複製代碼

CopyOnWriteArrayList在各類操做中都是先copy一份原來的array,而後操做,最後將原有的數據引用指向修改後的數據。

Vector

public class Vector extends AbstractListimplements List, RandomAccess, Cloneable,
       java.io.Serializable{}
複製代碼

與ArrayList類似,可是Vector是同步的。因此說Vector是線程安全的動態數組。它的操做與ArrayList幾乎同樣。

Vector,ArrayList與LinkedList區別,應用場景是什麼?

  • Vector實現了基於動態Object數組的數據結構,線程安全,能夠設置增加因子,效率比較低,不建議使用。
  • ArrayList實現了基於動態Object數組的數據結構,非線程安全,地址連續,查詢效率比較高,插入和刪除效率比較低。適合查詢操做頻繁的場景。
  • LinkedList實現了基於鏈表的數據結構,非線程安全,地址不連續,查詢效率比較低,插入和刪除效率比較高。適合插入和刪除操做頻繁的場景。
相關文章
相關標籤/搜索