HashMap、LinkedHashMap、HashSet、LinkedHashSet 原理解析及關係梳理

時間 2019-11-18

標籤 hashmap linkedhashmap hashset linkedhashset 原理解析關係梳理欄目 Java 简体版

原文原文鏈接

本文以jdk源碼爲線索學習幾種數據類型實現機制。java

【HashMap數據機制】node

HashMap提供了key、value存儲機制。
HashMap是LinkedHashMap的基類，其內部維護一個Node數組用來存儲數據：數組

transient Node<K,V>[] table;

爲了解決hash衝突，每一個節點存儲鏈表或者紅黑樹。當鏈表長度小於閾值8時，使用鏈表存儲；當長度達到閾值8時，將鏈表轉換爲紅黑樹提高讀寫效率：數據結構

if ((e = p.next) == null) {
	p.next = newNode(hash, key, value, null);
	if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
		treeifyBin(tab, hash);
}

A. put學習

public V put(K key, V value);

put數據時，首先依據key計算hash值，與數組尺寸作與運算，計算存儲數據在數組中的位置。
若該位置沒有數據（未發生hash衝突），直接依據hash值、key、value構造Node存入該位置：this

if ((p = tab[i = (n - 1) & hash]) == null)
	tab[i] = newNode(hash, key, value, null);

當存在衝突時，遍歷鏈表/紅黑樹查找當前key是否存在。若key已經存在，則替代舊的value：spa

V oldValue = e.value;
e.value = value;
afterNodeAccess(e);
return oldValue;

不然，將新的數據存入鏈表/紅黑樹：
插入鏈表：blog

if ((e = p.next) == null) {
	p.next = newNode(hash, key, value, null);

插入紅黑樹：接口

e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

在插入數據以後，執行回調方法：ci

afterNodeInsertion(evict);

當數據數量達到必定閾值時，resize()方法將被執行，對數組進行擴容。

Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;

B. remove

public V remove(Object key);

執行remove方法時，將首先依據要移除key的hash值定位在數組中的位置，
以後依據Node類型是TreeNode或鏈表對key進行查找。
當匹配上時，將node從鏈表或tree中移除，並將其value做爲remove方法返回值。
在remove以後，調用回調方法:

afterNodeRemoval(node);

【linkedHashMap】

爲了解決hashMap無序的問題，引入了有序存儲key、value的數據結構LinkedHashMap。
linkedHashMap以HashMap爲基類，提供了記錄插入key、value順序的功能，讀取時將按序輸出。

記錄的節點以雙向鏈表的形式存儲：

transient LinkedHashMap.Entry<K,V> head;
transient LinkedHashMap.Entry<K,V> tail;

A. put

基類HashMap中當插入數據時，構造新節點時執行newNode方法。
LinkedHashMap重寫了newNode方法：

Node<K,V> newNode(int hash, K key, V value, Node<K,V> e) {
	LinkedHashMap.Entry<K,V> p =
		new LinkedHashMap.Entry<K,V>(hash, key, value, e);
	linkNodeLast(p);
	return p;
}

每個put的key、value被構形成雙向鏈表節點p，最終被接在tail節點的後面，成爲新的tail節點：

LinkedHashMap.Entry<K,V> last = tail;
tail = p;
p.before = last;
last.after = p;

若put以前存在相同key的舊值，那麼就須要將舊值移除。
在插入完成以後，HashMap中會調用afterNodeInsertion方法，LinkedHashMap中實現此模板方法，將雙向鏈表中舊的節點移除。

B. remove

基類HashMap中當remove被調用，將相應key的節點移除後，回調方法afterNodeRemoval將被調用。
LinkedHashMap重寫了此方法，將相應key的節點從雙向鏈表中移除。

C. 讀取

LinkedHashMap內部的迭代器iterator以雙向鏈表head爲起點遍歷輸出，從而實現有序輸出的屬性。

【HashSet】

HashSet實現了Set接口，存儲一組不重複的元素。
爲了實現不重複的功能，其內部使用HashMap存儲數據，利用其key的惟一性：

public HashSet() {
	map = new HashMap<>();
}

執行add元素時，

public boolean add(E e) {
	return map.put(e, PRESENT)==null;
}

執行remove移除元素時，

public boolean remove(Object o) {
	return map.remove(o)==PRESENT;
}

遍歷元素時，直接使用HashMap的KeySet():

public Iterator<E> iterator() {
	return map.keySet().iterator();
}

因爲HashMap內部數據依據hash值在數組中存儲，所以HashSet的iterator也是無序的。

【LinkedHashSet】

爲了解決HashSet無序存儲的問題，引入了LinkedHashSet。

其內部利用了LinkedHashMap有序的特性：

HashSet(int initialCapacity, float loadFactor, boolean dummy) {
	map = new LinkedHashMap<>(initialCapacity, loadFactor);
}

其迭代器返回LinkedHashMap的KeySet，從而實現有序輸出。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。