HashMap底層維護一個數組,數組中的每一項都是一個Entryjava
1
|
transient
Entry<K,V>[] table;
|
咱們向 HashMap 中所放置的對象其實是存儲在該數組當中;數組
而Map中的key,value則以Entry的形式存放在數組中安全
1
2
3
4
5
|
static
class
Entry<K,V>
implements
Map.Entry<K,V> {
final
K key;
V value;
Entry<K,V> next;
int
hash;
|
而這個Entry應該放在數組的哪個位置上(這個位置一般稱爲位桶或者hash桶,即hash值相同的Entry會放在同一位置,用鏈表相連),是經過key的hashCode來計算的。app
1
2
3
4
5
6
7
|
final
int
hash(Object k) {
int
h =
0
;
h ^= k.hashCode();
h ^= (h >>>
20
) ^ (h >>>
12
);
return
h ^ (h >>>
7
) ^ (h >>>
4
);
}
|
經過hash計算出來的值將會使用indexFor方法找到它應該所在的table下標:性能
1
2
3
|
static
int
indexFor(
int
h,
int
length) {
return
h & (length-
1
);
}
|
這個方法其實至關於對table.length取模。this
當兩個key經過hashCode計算相同時,則發生了hash衝突(碰撞),HashMap解決hash衝突的方式是用鏈表。spa
當發生hash衝突時,則將存放在數組中的Entry設置爲新值的next(這裏要注意的是,好比A和B都hash後都映射到下標i中,以前已經有A了,當map.put(B)時,將B放到下標i中,A則爲B的next,因此新值存放在數組中,舊值在新值的鏈表上).net
示意圖:線程
因此當hash衝突不少時,HashMap退化成鏈表。code
總結一下map.put後的過程:
當向 HashMap 中 put 一對鍵值時,它會根據 key的 hashCode 值計算出一個位置, 該位置就是此對象準備往數組中存放的位置。
若是該位置沒有對象存在,就將此對象直接放進數組當中;若是該位置已經有對象存在了,則順着此存在的對象的鏈開始尋找(爲了判斷是不是否值相同,map不容許<key,value>鍵值對重複), 若是此鏈上有對象的話,再去使用 equals方法進行比較,若是對此鏈上的每一個對象的 equals 方法比較都爲 false,則將該對象放到數組當中,而後將數組中該位置之前存在的那個對象連接到此對象的後面。
值得注意的是,當key爲null時,都放到table[0]中
1
2
3
4
5
6
7
8
9
10
11
12
13
|
private
V putForNullKey(V value) {
for
(Entry<K,V> e = table[
0
]; e !=
null
; e = e.next) {
if
(e.key ==
null
) {
V oldValue = e.value;
e.value = value;
e.recordAccess(
this
);
return
oldValue;
}
}
modCount++;
addEntry(
0
,
null
, value,
0
);
return
null
;
}
|
當size大於threshold時,會發生擴容。 threshold等於capacity*load factor
1
2
3
4
5
6
7
8
9
|
void
addEntry(
int
hash, K key, V value,
int
bucketIndex) {
if
((size >= threshold) && (
null
!= table[bucketIndex])) {
resize(
2
* table.length);
hash = (
null
!= key) ? hash(key) :
0
;
bucketIndex = indexFor(hash, table.length);
}
createEntry(hash, key, value, bucketIndex);
}
|
jdk7中resize,只有當 size>=threshold而且 table中的那個槽中已經有Entry時,纔會發生resize。即有可能雖然size>=threshold,可是必須等到每一個槽都至少有一個Entry時,纔會擴容。還有注意每次resize都會擴大一倍容量
一直到JDK7爲止,HashMap的結構都是這麼簡單,基於一個數組以及多個鏈表的實現,hash值衝突的時候,就將對應節點以鏈表的形式存儲。
這樣子的HashMap性能上就抱有必定疑問,若是說成百上千個節點在hash時發生碰撞,存儲一個鏈表中,那麼若是要查找其中一個節點,那就不可避免的花費O(N)的查找時間,這將是多麼大的性能損失。這個問題終於在JDK8中獲得瞭解決。再最壞的狀況下,鏈表查找的時間複雜度爲O(n),而紅黑樹一直是O(logn),這樣會提升HashMap的效率。
JDK7中HashMap採用的是位桶+鏈表的方式,即咱們常說的散列鏈表的方式,而JDK8中採用的是位桶+鏈表/紅黑樹(有關紅黑樹請查看紅黑樹)的方式,也是非線程安全的。當某個位桶的鏈表的長度達到某個閥值的時候,這個鏈表就將轉換成紅黑樹。
JDK8中,當同一個hash值的節點數不小於8時,將再也不以單鏈表的形式存儲了,會被調整成一顆紅黑樹(上圖中null節點沒畫)。這就是JDK7與JDK8中HashMap實現的最大區別。
接下來,咱們來看下JDK8中HashMap的源碼實現。
JDK中Entry的名字變成了Node,緣由是和紅黑樹的實現TreeNode相關聯。
1
|
transient
Node<K,V>[] table;
|
當衝突節點數不小於8-1時,轉換成紅黑樹。
1
|
static
final
int
TREEIFY_THRESHOLD =
8
;
|
以put方法在JDK8中有了很大的改變
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
|
public
V put(K key, V value) {
return
putVal(hash(key), key, value,
false
,
true
);
}
final
V putVal(
int
hash, K key, V value,
boolean
onlyIfAbsent,
boolean
evict) {
Node<K,V>[] tab;
Node<K,V> p;
int
n, i;
//若是當前map中無數據,執行resize方法。而且返回n
if
((tab = table) ==
null
|| (n = tab.length) ==
0
)
n = (tab = resize()).length;
//若是要插入的鍵值對要存放的這個位置恰好沒有元素,那麼把他封裝成Node對象,放在這個位置上就完事了
if
((p = tab[i = (n -
1
) & hash]) ==
null
)
tab[i] = newNode(hash, key, value,
null
);
//不然的話,說明這上面有元素
else
{
Node<K,V> e; K k;
//若是這個元素的key與要插入的同樣,那麼就替換一下,也完事。
if
(p.hash == hash &&
((k = p.key) == key || (key !=
null
&& key.equals(k))))
e = p;
//1.若是當前節點是TreeNode類型的數據,執行putTreeVal方法
else
if
(p
instanceof
TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(
this
, tab, hash, key, value);
else
{
//仍是遍歷這條鏈子上的數據,跟jdk7沒什麼區別
for
(
int
binCount =
0
; ; ++binCount) {
if
((e = p.next) ==
null
) {
p.next = newNode(hash, key, value,
null
);
//2.完成了操做後多作了一件事情,判斷,而且可能執行treeifyBin方法
if
(binCount >= TREEIFY_THRESHOLD -
1
)
// -1 for 1st
treeifyBin(tab, hash);
break
;
}
if
(e.hash == hash &&
((k = e.key) == key || (key !=
null
&& key.equals(k))))
break
;
p = e;
}
}
if
(e !=
null
) {
// existing mapping for key
V oldValue = e.value;
if
(!onlyIfAbsent || oldValue ==
null
)
//true || --
e.value = value;
//3.
afterNodeAccess(e);
return
oldValue;
}
}
++modCount;
//判斷閾值,決定是否擴容
if
(++size > threshold)
resize();
//4.
afterNodeInsertion(evict);
return
null
;
}
|
treeifyBin()就是將鏈表轉換成紅黑樹。
以前的indefFor()方法消失 了,直接用(tab.length-1)&hash,因此看到這個,表明的就是數組的下角標。
1
2
3
4
|
static
final
int
hash(Object key) {
int
h;
return
(key ==
null
) ?
0
: (h = key.hashCode()) ^ (h >>>
16
);
}
|