集合框架知識的梳理

時間 2019-11-14

原文原文鏈接

1. Iterator接口

Iterator接口，這是一個用於遍歷集合中元素的接口，主要包含hashNext(),next(),remove()三種方法。它的一個子接口LinkedIterator在它的基礎上又添加了三種方法，分別是add(),previous(),hasPrevious()。也就是說若是是先Iterator接口，那麼在遍歷集合中元素的時候，只能日後遍歷，被遍歷後的元素不會在遍歷到，一般無序集合實現的都是這個接口，好比HashSet，HashMap；而那些元素有序的集合，實現的通常都是LinkedIterator接口，實現這個接口的集合能夠雙向遍歷，既能夠經過next()訪問下一個元素，又能夠經過previous()訪問前一個元素，好比ArrayList。java

2. List

List是元素有序而且能夠重複的集合。
List的主要實現：ArrayList, LinkedList, Vector。算法

2. ArrayList、LinkedList、Vector 的區別

	ArrayList	LinkedList	Vector
底層實現	數組	雙向循環鏈表	數組
同步性及效率	不一樣步，非線程安全，效率高	不一樣步，非線程安全，效率高	同步，線程安全，效率低
特色	查詢快,增刪慢	查詢慢,增刪快	查詢快,增刪慢
默認容量	10	/	10
擴容機制	int newCapacity = oldCapacity + (oldCapacity >> 1); //1.5 倍	/	2 倍

總結：數組

ArrayList 和 Vector 基於數組實現，對於隨機訪問get和set，ArrayList優於LinkedList，由於LinkedList要移動指針。

LinkedList 不會出現擴容的問題，因此比較適合隨機位置增、刪。可是其基於鏈表實現，因此在定位時須要線性掃描，效率比較低。
當操做是在一列數據的後面添加數據而不是在前面或中間,而且須要隨機地訪問其中的元素時,使用ArrayList會提供比較好的性能；
當你的操做是在一列數據的前面或中間添加或刪除數據,而且按照順序訪問其中的元素時,就應該使用LinkedList了。

3. Set

Set集合中的對象不按特定的方式排序(存入和取出的順序不必定一致)，而且沒有重複對象。
Set的主要實現類：HashSet, TreeSet。安全

	HashSet	TreeSet	LinkedHashSet
底層實現	HashMap	紅黑樹	LinkedHashMap
重複性	不容許重複	不容許重複	不容許重複
有/無序	無序	有序，支持兩種排序方式，天然排序和定製排序，其中天然排序爲默認的排序方式。	有序，以元素插入的順序來維護集合的連接表
時間複雜度	add()，remove()，contains()方法的時間複雜度是O(1)	add()，remove()，contains()方法的時間複雜度是O(logn)	LinkedHashSet在迭代訪問Set中的所有元素時，性能比HashSet好，可是插入時性能稍微遜色於HashSet，時間複雜度是 O(1)。
同步性	不一樣步，線程不安全	不一樣步，線程不安全	不一樣步，線程不安全
null值	容許null值	不支持null值，會拋出 java.lang.NullPointerException 異常。由於TreeSet應用 compareTo() 方法於各個元素來比較他們，當比較null值時會拋出 NullPointerException異常。	容許null值
比較	equals()	compareTo()	equals()

HashSet如何檢查重複

當你把對象加入HashSet時，HashSet會先計算對象的hashcode值來判斷對象加入的位置，同時也會與其餘加入的對象的hashcode值做比較，若是沒有相符的hashcode，HashSet會假設對象沒有重複出現。可是若是發現有相同hashcode值的對象，這時會調用equals（）方法來檢查hashcode相等的對象是否真的相同。若是二者相同，HashSet就不會讓加入操做成功。
hashCode（）與equals（）的相關規定：數據結構

若是兩個對象相等，則hashcode必定也是相同的
兩個對象相等,對兩個equals方法返回true
兩個對象有相同的hashcode值，它們也不必定是相等的
綜上，equals方法被覆蓋過，則hashCode方法也必須被覆蓋
hashCode()的默認行爲是對堆上的對象產生獨特值。若是沒有重寫hashCode()，則該class的兩個對象不管如何都不會相等（即便這兩個對象指向相同的數據）。

總結：
HashSet是一個通用功能的Set，而LinkedHashSet 提供元素插入順序保證，TreeSet是一個SortedSet實現，由Comparator 或者 Comparable指定的元素順序存儲元素。多線程

4. Map

Map 是一種把鍵對象和值對象映射的集合，它的每個元素都包含一對鍵對象和值對象。 Map沒有繼承於Collection接口從Map集合中檢索元素時，只要給出鍵對象，就會返回對應的值對象。
Map 的經常使用實現類：HashMap、TreeMap、HashTable、LinkedHashMap、ConcurrentHashMap併發

	HashMap	HashTable
底層實現	數組+鏈表	數組+鏈表
同步性	線程不一樣步	同步
null值	容許 key 和 Vale 是 null，可是隻容許一個 key 爲 null,且這個元素存放在哈希表 0 角標位置	不容許key、value 是 null
hash	使用hash(Object key)擾動函數對 key 的 hashCode 進行擾動後做爲 hash 值	直接使用 key 的 hashCode() 返回值做爲 hash 值
容量	容量爲 2^4 且容量必定是 2^n	默認容量是11,不必定是 2^n
擴容	兩倍，且哈希桶的下標使用 &運算代替了取模	2倍+1，取哈希桶下標是直接用模運算

幾個問題：

1. HashMap 的工做原理？
經過hash的方法，經過put和get存儲和獲取對象。存儲對象時，咱們將K/V傳給put方法時，它調用hashCode計算hash從而獲得bucket位置，進一步存儲，HashMap會根據當前bucket的佔用狀況自動調整容量(超過Load Facotr則resize爲原來的2倍)。獲取對象時，咱們將K傳給get，它調用hashCode計算hash從而獲得bucket位置，並進一步調用equals()方法肯定鍵值對。若是發生碰撞的時候，Hashmap經過鏈表將產生碰撞衝突的元素組織起來，在Java 8中，若是一個bucket中碰撞衝突的元素超過某個限制(默認是8)，則使用紅黑樹來替換鏈表，從而提升效率。
2.get和put的原理嗎？equals()和hashCode()的都有什麼做用？
經過對key的hashCode()進行hashing，並計算下標( n-1 & hash)，從而得到buckets的位置。若是產生碰撞，則利用key.equals()方法去鏈表或樹中去查找對應的節點
3. HashMap 的長度爲何是2的冪次方？
爲了能讓 HashMap 存取高效，儘可能較少碰撞，也就是要儘可能把數據分配均勻，每一個鏈表/紅黑樹長度大體相同。這個實現就是把數據存到哪一個鏈表/紅黑樹中的算法。框架

HashMap 和 LinkedHashMap 的區別

LinkedHashMap 擁有與 HashMap 相同的底層哈希表結構，即數組 + 單鏈表 + 紅黑樹，也擁有相同的擴容機制。
LinkedHashMap 相比 HashMap 的拉鍊式存儲結構，內部額外經過 Entry 維護了一個雙向鏈表。
HashMap 元素的遍歷順序不必定與元素的插入順序相同，而 LinkedHashMap 則經過遍歷雙向鏈表來獲取元素，因此遍歷順序在必定條件下等於插入順序。
LinkedHashMap 能夠經過構造參數 accessOrder 來指定雙向鏈表是否在元素被訪問後改變其在雙向鏈表中的位置。

HashMap & TreeMap 的區別

HashMap實現了Map接口，不保障元素順序。
TreeMap實現了SortedMap接口，是一個有序的Map。內部採用紅黑樹實現，紅黑樹是一種維護有序數據的高效數據結構函數

ConcurrentHashMap 和 Hashtable 的區別

ConcurrentHashMap 和 Hashtable 的區別主要體如今實現線程安全的方式上不一樣。
底層數據結構： JDK1.7的 ConcurrentHashMap 底層採用分段的數組+鏈表實現，JDK1.8 採用的數據結構跟HashMap1.8的結構同樣，數組+鏈表/紅黑二叉樹。Hashtable 和 JDK1.8 以前的 HashMap 的底層數據結構相似都是採用數組+鏈表的形式，數組是 HashMap 的主體，鏈表則是主要爲了解決哈希衝突而存在的；
實現線程安全的方式（重要）： ① 在JDK1.7的時候，ConcurrentHashMap（分段鎖）對整個桶數組進行了分割分段(Segment)，每一把鎖只鎖容器其中一部分數據，多線程訪問容器裏不一樣數據段的數據，就不會存在鎖競爭，提升併發訪問率。（默認分配16個Segment，比Hashtable效率提升16倍。）到了 JDK1.8 的時候已經摒棄了Segment的概念，而是直接用 Node 數組+鏈表+紅黑樹的數據結構來實現，併發控制使用 synchronized 和 CAS 來操做。（JDK1.6之後對 synchronized鎖作了不少優化）整個看起來就像是優化過且線程安全的 HashMap，雖然在JDK1.8中還能看到 Segment 的數據結構，可是已經簡化了屬性，只是爲了兼容舊版本；② Hashtable(同一把鎖) :使用 synchronized 來保證線程安全，效率很是低下。當一個線程訪問同步方法時，其餘線程也訪問同步方法，可能會進入阻塞或輪詢狀態，如使用 put 添加元素，另外一個線程不能使用 put 添加元素，也不能使用 get，競爭會愈來愈激烈效率越低。
高併發

HashMap的底層實現

JDK1.8 以前 HashMap 由 數組+鏈表 組成的（「鏈表散列」 即數組和鏈表的結合體），數組是 HashMap 的主體，鏈表則是主要爲了解決哈希衝突而存在的（HashMap 採用 「拉鍊法也就是鏈地址法」 解決衝突），若是定位到的數組位置不含鏈表（當前 entry 的 next 指向 null ）,那麼對於查找，添加等操做很快，僅需一次尋址便可；若是定位到的數組包含鏈表，對於添加操做，其時間複雜度依然爲 O(1)，由於最新的 Entry 會插入鏈表頭部，急須要簡單改變引用鏈便可，而對於查找操做來說，此時就須要遍歷鏈表，而後經過 key 對象的 equals 方法逐一比對查找.所謂 「拉鍊法」 就是將鏈表和數組相結合。也就是說建立一個鏈表數組，數組中每一格就是一個鏈表。若遇到哈希衝突，則將衝突的值加到鏈表中便可。

相比於以前的版本， JDK1.8以後在解決哈希衝突時有了較大的變化，當鏈表長度大於閾值（默認爲8）時，將鏈表轉化爲紅黑樹，以減小搜索時間。

TreeMap、TreeSet以及JDK1.8以後的HashMap底層都用到了紅黑樹。紅黑樹就是爲了解決二叉查找樹的缺陷，由於二叉查找樹在某些狀況下會退化成一個線性結構。

ConcurrentHashMap線程安全的具體實現方式/底層具體實現

在jdk1.8以前,首先將數據分爲一段一段的存儲，而後給每一段數據配一把鎖，當一個線程佔用鎖訪問其中一個段數據時，其餘段的數據也能被其餘線程訪問。

ConcurrentHashMap 是由 Segment 數組結構和 HahEntry 數組結構組成。

Segment 實現了 ReentrantLock,因此 Segment 是一種可重入鎖，扮演鎖的角色。HashEntry 用於存儲鍵值對數據。

static class Segment<K,V> extends ReentrantLock implements Serializable { } 複製代碼

一個 ConcurrentHashMap 裏包含一個 Segment 數組。Segment 的結構和HashMap相似，是一種數組和鏈表結構，一個 Segment 包含一個 HashEntry 數組，每一個 HashEntry 是一個鏈表結構的元素，每一個 Segment 守護着一個HashEntry數組裏的元素，當對 HashEntry 數組的數據進行修改時，必須首先得到對應的 Segment的鎖。

在jdk1.8時,ConcurrentHashMap取消了Segment分段鎖，採用CAS和synchronized來保證併發安全。數據結構跟HashMap1.8的結構相似，數組+鏈表/紅黑二叉樹。

synchronized只鎖定當前鏈表或紅黑二叉樹的首節點，這樣只要hash不衝突，就不會產生併發，效率又提高N倍。

集合框架底層數據結構總結

Collection

1. List

Arraylist： Object數組
Vector： Object數組
LinkedList： 雙向循環鏈表

2. Set

HashSet（無序，惟一）: 基於 HashMap 實現的，底層採用 HashMap 來保存元素
LinkedHashSet： LinkedHashSet 繼承與 HashSet，而且其內部是經過 LinkedHashMap 來實現的。有點相似於咱們以前說的LinkedHashMap 其內部是基於 Hashmap 實現同樣，不過仍是有一點點區別的。
TreeSet（有序，惟一）： 紅黑樹(自平衡的排序二叉樹。)

Map

HashMap： JDK1.8以前HashMap由數組+鏈表組成的，數組是HashMap的主體，鏈表則是主要爲了解決哈希衝突而存在的（「拉鍊法」解決衝突）.JDK1.8之後在解決哈希衝突時有了較大的變化，當鏈表長度大於閾值（默認爲8）時，將鏈表轉化爲紅黑樹，以減小搜索時間
LinkedHashMap: LinkedHashMap 繼承自 HashMap，因此它的底層仍然是基於拉鍊式散列結構即由數組和鏈表或紅黑樹組成。另外，LinkedHashMap 在上面結構的基礎上，增長了一條雙向鏈表，使得上面的結構能夠保持鍵值對的插入順序。同時經過對鏈表進行相應的操做，實現了訪問順序相關邏輯。詳細能夠查看：《LinkedHashMap 源碼詳細分析（JDK1.8）》
HashTable: 數組+鏈表組成的，數組是 HashMap 的主體，鏈表則是主要爲了解決哈希衝突而存在的
TreeMap: 紅黑樹（自平衡的排序二叉樹）

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。