Java語言中,提供了一套數據集合框架,其中定義了一些諸如List、Set等抽象數據類型,每一個抽象數據類型的各個具體實現,底層又採用了不一樣的實現方式,好比ArrayList和LinkedList。java
除此以外,Java對於數據集合的遍歷,也提供了幾種不一樣的方式。開發人員必需要清楚的明白每一種遍歷方式的特色、適用場合、以及在不一樣底層實現上的表現。下面就詳細分析一下這一塊內容。node
數據元素在內存中,主要有2種存儲方式:設計模式
這種方式,相鄰的數據元素存放於相鄰的內存地址中,整塊內存地址是連續的。能夠根據元素的位置直接計算出內存地址,直接進行讀取。讀取一個特定位置元素的平均時間複雜度爲O(1)。正常來講,只有基於數組實現的集合,纔有這種特性。Java中以ArrayList爲表明。數組
這種方式,每個數據元素,在內存中都不要求處於相鄰的位置,每一個數據元素包含它下一個元素的內存地址。不能夠根據元素的位置直接計算出內存地址,只能按順序讀取元素。讀取一個特定位置元素的平均時間複雜度爲O(n)。主要以鏈表爲表明。Java中以LinkedList爲表明。框架
遍歷者本身在集合外部維護一個計數器,而後依次讀取每個位置的元素,當讀取到最後一個元素後,中止。主要就是須要按元素的位置來讀取元素。這也是最原始的集合遍歷方法。dom
寫法爲:oop
for (int i = 0; i < list.size(); i++) { list.get(i); }
Iterator原本是OO的一個設計模式,主要目的就是屏蔽不一樣數據集合的特色,統一遍歷集合的接口。Java做爲一個OO語言,天然也在Collections中支持了Iterator模式。性能
寫法爲:優化
Iterator iterator = list.iterator(); while (iterator.hasNext()) { iterator.next(); }
屏蔽了顯式聲明的Iterator和計數器。spa
優勢:代碼簡潔,不易出錯。
缺點:只能作簡單的遍歷,不能在遍歷過程當中操做(刪除、替換)數據集合。
寫法爲:
for (ElementType element : list) { }
遍歷者本身在集合外部維護一個計數器,而後依次讀取每個位置的元素,當讀取到最後一個元素後,中止。主要就是須要按元素的位置來讀取元素。
每個具體實現的數據集合,通常都須要提供相應的Iterator。相比於傳統for循環,Iterator取締了顯式的遍歷計數器。因此基於順序存儲集合的Iterator能夠直接按位置訪問數據。而基於鏈式存儲集合的Iterator,正常的實現,都是須要保存當前遍歷的位置。而後根據當前位置來向前或者向後移動指針。
根據反編譯的字節碼能夠發現,foreach內部也是採用了Iterator的方式實現,只不過Java編譯器幫咱們生成了這些代碼。
由於是基於元素的位置,按位置讀取。因此咱們能夠知道,對於順序存儲,由於讀取特定位置元素的平均時間複雜度是O(1),因此遍歷整個集合的平均時間複雜度爲O(n)。而對於鏈式存儲,由於讀取特定位置元素的平均時間複雜度是O(n),因此遍歷整個集合的平均時間複雜度爲O(n2)(n的平方)。
ArrayList按位置讀取的代碼:直接按元素位置讀取。
transient Object[] elementData; public E get(int index) { rangeCheck(index); return elementData(index); } E elementData(int index) { return (E) elementData[index]; }
LinkedList按位置讀取的代碼:每次都須要從第0個元素開始向後讀取。其實它內部也作了小小的優化。
transient int size = 0; transient Node<E> first; transient Node<E> last; public E get(int index) { checkElementIndex(index); return node(index).item; } Node<E> node(int index) { if (index < (size >> 1)) { //查詢位置在鏈表前半部分,從鏈表頭開始查找 Node<E> x = first; for (int i = 0; i < index; i++) x = x.next; return x; } else { //查詢位置在鏈表後半部分,從鏈表尾開始查找 Node<E> x = last; for (int i = size - 1; i > index; i--) x = x.prev; return x; } }
那麼對於RandomAccess類型的集合來講,沒有太多意義,反而由於一些額外的操做,還會增長額外的運行時間。可是對於Sequential Access的集合來講,就有很重大的意義了,由於Iterator內部維護了當前遍歷的位置,因此每次遍歷,讀取下一個位置並不須要從集合的第一個元素開始查找,只要把指針向後移一位就好了,這樣一來,遍歷整個集合的時間複雜度就下降爲O(n);
(這裏只用LinkedList作例子)LinkedList的迭代器,內部實現,就是維護當前遍歷的位置,而後操做指針移動就能夠了:
代碼:
public E next() { checkForComodification(); if (!hasNext()) throw new NoSuchElementException(); lastReturned = next; next = next.next; nextIndex++; return lastReturned.item; } public E previous() { checkForComodification(); if (!hasPrevious()) throw new NoSuchElementException(); lastReturned = next = (next == null) ? last : next.prev; nextIndex--; return lastReturned.item; }
分析Java字節碼可知,foreach內部實現原理,也是經過Iterator實現的,只不過這個Iterator是Java編譯器幫咱們生成的,因此咱們不須要再手動去編寫。可是由於每次都要作類型轉換檢查,因此花費的時間比Iterator略長。時間複雜度和Iterator同樣。
使用Iterator的字節碼:
Code: 0: new #16 // class java/util/ArrayList 3: dup 4: invokespecial #18 // Method java/util/ArrayList."<init>":()V 7: astore_1 8: aload_1 9: invokeinterface #19, 1 // InterfaceMethod java/util/List.iterator:()Ljava/util/Iterator; 14: astore_2 15: goto 25 18: aload_2 19: invokeinterface #25, 1 // InterfaceMethod java/util/Iterator.next:()Ljava/lang/Object; 24: pop 25: aload_2 26: invokeinterface #31, 1 // InterfaceMethod java/util/Iterator.hasNext:()Z 31: ifne 18 34: return
使用foreach的字節碼:
Code: 0: new #16 // class java/util/ArrayList 3: dup 4: invokespecial #18 // Method java/util/ArrayList."<init>":()V 7: astore_1 8: aload_1 9: invokeinterface #19, 1 // InterfaceMethod java/util/List.iterator:()Ljava/util/Iterator; 14: astore_3 15: goto 28 18: aload_3 19: invokeinterface #25, 1 // InterfaceMethod java/util/Iterator.next:()Ljava/lang/Object; 24: checkcast #31 // class loop/Model 27: astore_2 28: aload_3 29: invokeinterface #33, 1 // InterfaceMethod java/util/Iterator.hasNext:()Z 34: ifne 18 37: return
順序存儲:讀取性能比較高。適用於遍歷順序存儲集合。
鏈式存儲:時間複雜度太大,不適用於遍歷鏈式存儲的集合。
順序存儲:若是不是太在乎時間,推薦選擇此方式,畢竟代碼更加簡潔,也防止了Off-By-One的問題。
鏈式存儲:意義就重大了,平均時間複雜度降爲O(n),仍是挺誘人的,因此推薦此種遍歷方式。
foreach只是讓代碼更加簡潔了,可是他有一些缺點,就是遍歷過程當中不能操做數據集合(刪除等),因此有些場合不使用。並且它自己就是基於Iterator實現的,可是因爲類型轉換的問題,因此會比直接使用Iterator慢一點,可是還好,時間複雜度都是同樣的。因此怎麼選擇,參考上面兩種方式,作一個折中的選擇。
Java數據集合框架中,提供了一個RandomAccess接口,該接口沒有方法,只是一個標記。一般被List接口的實現使用,用來標記該List的實現是否支持Random Access。
一個數據集合實現了該接口,就意味着它支持Random Access,按位置讀取元素的平均時間複雜度爲O(1)。好比ArrayList。
而沒有實現該接口的,就表示不支持Random Access。好比LinkedList。
因此看來JDK開發者也是注意到這個問題的,那麼推薦的作法就是,若是想要遍歷一個List,那麼先判斷是否支持Random Access,也就是 list instanceof RandomAccess。
好比:
if (list instanceof RandomAccess) { //使用傳統的for循環遍歷。 } else { //使用Iterator或者foreach。 }