JAVA集合框架的特色及實現原理簡介

1.集合框架整體架構

collection
圖片描述

  • 集合大體分爲Set、List、Queue、Map四種體系,其中List,Set,Queue繼承自Collection接口,Map爲獨立接口
  • Set的實現類有:HashSet,LinkedHashSet,TreeSet...
  • List下有ArrayList,Vector,LinkedList...
  • Map下有Hashtable,LinkedHashMap,HashMap,TreeMap...
list 有序,可重複 ArrayList:數組,查詢快,增刪慢。線程不安全. Vector:數組,查詢快,增刪慢。線程安全. LinkedList:鏈表,查詢慢,增刪快。線程不安全
set 無序(不嚴謹),惟一 HashSet:無序,惟一,哈希表實現,經過hashCode()和equals()保證惟一。 LinkedHashSet:繼承自hashset,底層是鏈表和哈希表。(FIFO插入有序,惟一) TreeSet:底層是紅黑樹。(惟一,有序)
map KV形式的鍵值對 TreeMap:有序,不是線程安全的。 HashMap:無序,不是線程安全的,HashMap容許null值(key和value都容許) HashTable:無序,線程安全的,不容許null值,

2. Set

Set 接口繼承Collection,用於存儲不含重複元素的集合。
Set是簡化版的Map。Set把元素做爲key存儲在本身的Map實例中(Entry),value則是一個空的Object。

HashSet

底層是哈希表,當插入元素時,HashSet會調用該對象的hashCode()方法獲得hashCode,而後根據hashCode決定該對象在哈希表中的存儲位置。(這裏有個問題,若是hashcode不是均勻分佈的,而是集中在一個區域,極端狀況下,hash表會變成鏈表)
HashSet去重原理:經過equals()方法比較,且其hashCode()方法返回值也相等。 (能夠經過覆寫hashCode和equals方法改變其去重規則,進行自定義去重)java

TreeSet

TreeSet底層是紅黑樹;加入元素時,必須加入同類型的對象,不然會發生ClassCastException異常,由於TreeSet會調用集合元素的compareTo()方法來比較元素之間的大小關係(天然排序)。
compareTo()方法的返回值決定了順序:算法

  • -1 表示放在紅黑樹的左邊,即逆序輸出;
  • 1 表示放在紅黑樹的右邊,即順序輸出;
  • 0 表示元素相同,僅存放第一個元素天然排序(treeset去重的原理);

其次,TreeSet也能夠經過比較器排序。數組

LinkedHashSet

繼承自HashSet,底層是鏈表和哈希表。安全

  • 由鏈表保證元素有序(插入順序)。
  • 由哈希表保證元素惟一

TreeSet, LinkedHashSet and HashSet 的區別

  • 都實現Set接口,不包含重複元素
  • 都不是線程安全的,若是要使用線程安全能夠Collections.synchronizedSet()
  • TreeSet的主要功能用於排序
  • LinkedHashSet的主要功能用於保證FIFO,即有序的集合(先進先出)
  • HashSet只是通用的存儲數據的集合
  • 插入速度: HashSet>LinkHashSet>TreeSet(內部實現排序)
  • HashSet不保證順序,LinkHashSet保證FIFO(先進先出),TreeSet安裝內部實現排序,也能夠自定義排序規則
  • HashSet和LinkHashSet容許null, (只能有一個null) 但TreeSet中插入null時會報NullPointerException

3. List

list的實現類有ArrayList,Vector,LinkedList...其中ArrayList和Vector很類似,均是以數組做爲底層實現,不一樣之處在於Vector是線程安全的。

ArrayList

ArrayList基於數組實現,不是線程安全的,內部維護了一個可變長的對象數組,集合內全部元素存儲於這個數組中,並實現該數組長度的動態伸縮。
ArrayList使用數組拷貝來實現指定位置的插入和刪除。數據結構

LinkedList

LinkedList內部以鏈表的形式來保存元素,所以隨機訪問集合時性能較差,但插入,刪除元素時性能較好。
LinkedList不只實現了List接口,還實現了Deque接口,能夠被當成雙端隊列來使用,便可被當成「棧」來使用,也能夠當成隊列使用。架構

ArrayList 和LinkedList比較

  • 二者都是List接口的實現類,都不是線程安全。List的另一個實現類vector是線程安全的。
  • ArrayList是基於動態數組的數據結構,而LinkedList是基於鏈表的數據結構。
  • 對於隨機訪問get和set(查詢操做),ArrayList要優於LinkedList.(LinkedList要移動指針)
  • 對於增刪操做(add和remove),LinkedList優於ArrayList。

4. Map

Map集合用於保存映射關係的數據,Map集合中保存了兩組值,一組是 key, 一組是 value。
Map的key不能重複。
key和value之間存在單向一對一的關係, 經過key,能找到惟一肯定的value。
Map將key和value封裝至一個叫作Entry的對象中,Map中存儲的元素實際是Entry。只有在keySet()和values()方法被調用時,Map纔會將keySet和values對象實例化。

HashMap

key 是經過hash表來存儲,value是經過鏈表來存儲。
HashMap將Entry對象存儲在一個數組中,並經過哈希表來實現對Entry的快速訪問。(經過key的哈希值計算Entry在數組中的index,以此訪問value) (拉鍊法,解決hash碰撞)併發

HashTable

幾乎和HashMap同樣,都是經過數組存儲Entry,以key的哈希值計算Entry在數組中的index,用拉鍊法解決哈希衝突。兩者最大的不一樣在於,Hashtable是線程安全的,其提供的方法幾乎都是同步的。框架

ConcurrentHashMap

ConcurrentHashMap是HashMap的線程安全版,提供比Hashtable更高效的併發性能。源碼分析

Hashtable 在進行讀寫操做時會鎖住整個Entry數組,這就致使數據越多性能越差。
ConcurrentHashMap使用分離鎖的思路解決併發性能,其將 Entry數組拆分至16個Segment中,以哈希算法決定Entry應該存儲在哪一個Segment。這樣就能夠實如今寫操做時只對一個Segment 加鎖,大幅提高了併發寫的性能。
在進行讀操做時,ConcurrentHashMap在絕大部分狀況下都不須要加鎖,其Entry中的value是volatile的,這保證了value被修改時的線程可見性,無需加鎖便能實現線程安全的讀操做。
ConcurrentHashMap它不能保證讀操做的絕對一致性。ConcurrentHashMap保證讀操做能獲取到已存在Entry的value的最新值,同時也能保證讀操做可獲取到已完成的寫操做的內容,但若是寫操做是在建立一個新的Entry,那麼在寫操做沒有完成時,讀操做是有可能獲取不到這個Entry的。

HashMap和HashTable,ConcurrentHashMap的區別

  • 三者在數據存儲層面的機制原理基本一致
  • HashMap不是線程安全的
  • Hashtable是線程安全的,能保證絕對的數據一致性
  • ConcurrentHashMap 也是線程安全的,使用分離鎖和volatile等方法極大地提高了讀寫性能,同時也能保證在絕大部分狀況下的數據一致性。但其不能保證絕對的數據一致性,在一個線程向Map中加入Entry的操做沒有徹底完成以前,其餘線程有可能讀不到新加入的Entry
  • HashTable不容許使用null做爲key和value,若是放入null將引起NullPointerException異常,但HashMap可使用null做爲key或value(只能有一個key爲null,能夠多個value爲null)。
  • 若是在遍歷的同時,修改HashTable的大小,容易應發異常。能夠用代替,ConcurrentHashMap是HashMap的線程安全版,提供比Hashtable更高效的併發性能

參考資料:
JAVA集合框架中的經常使用集合及其特色、適用場景、實現原理簡介
java集合框架總結以及源碼分析性能

相關文章
相關標籤/搜索