JDK7與JDK8中HashMap的實現

JDK7中的HashMap

HashMap底層維護一個數組,數組中的每一項都是一個Entryjava

1
transient Entry<K,V>[] table;

咱們向 HashMap 中所放置的對象其實是存儲在該數組當中;數組

而Map中的key,value則以Entry的形式存放在數組中安全

1
2
3
4
5
static class Entry<K,V> implements Map.Entry<K,V> {
         final K key;
         V value;
         Entry<K,V> next;
         int hash;

而這個Entry應該放在數組的哪個位置上(這個位置一般稱爲位桶或者hash桶,即hash值相同的Entry會放在同一位置,用鏈表相連),是經過key的hashCode來計算的。app

1
2
3
4
5
6
7
final int hash(Object k) {
         int h = 0 ;
         h ^= k.hashCode();
 
         h ^= (h >>> 20 ) ^ (h >>> 12 );
         return h ^ (h >>> 7 ) ^ (h >>> 4 );
     }

經過hash計算出來的值將會使用indexFor方法找到它應該所在的table下標:性能

1
2
3
static int indexFor( int h, int length) {
         return h & (length- 1 );
     }

這個方法其實至關於對table.length取模。this

當兩個key經過hashCode計算相同時,則發生了hash衝突(碰撞),HashMap解決hash衝突的方式是用鏈表。spa

當發生hash衝突時,則將存放在數組中的Entry設置爲新值的next(這裏要注意的是,好比A和B都hash後都映射到下標i中,以前已經有A了,當map.put(B)時,將B放到下標i中,A則爲B的next,因此新值存放在數組中,舊值在新值的鏈表上).net

示意圖:線程

因此當hash衝突不少時,HashMap退化成鏈表。code

總結一下map.put後的過程:

當向 HashMap 中 put 一對鍵值時,它會根據 key的 hashCode 值計算出一個位置, 該位置就是此對象準備往數組中存放的位置。

若是該位置沒有對象存在,就將此對象直接放進數組當中;若是該位置已經有對象存在了,則順着此存在的對象的鏈開始尋找(爲了判斷是不是否值相同,map不容許<key,value>鍵值對重複), 若是此鏈上有對象的話,再去使用 equals方法進行比較,若是對此鏈上的每一個對象的 equals 方法比較都爲 false,則將該對象放到數組當中,而後將數組中該位置之前存在的那個對象連接到此對象的後面。

值得注意的是,當key爲null時,都放到table[0]中

1
2
3
4
5
6
7
8
9
10
11
12
13
private V putForNullKey(V value) {
         for (Entry<K,V> e = table[ 0 ]; e != null ; e = e.next) {
             if (e.key == null ) {
                 V oldValue = e.value;
                 e.value = value;
                 e.recordAccess( this );
                 return oldValue;
             }
         }
         modCount++;
         addEntry( 0 , null , value, 0 );
         return null ;
     }

當size大於threshold時,會發生擴容。 threshold等於capacity*load factor

1
2
3
4
5
6
7
8
9
void addEntry( int hash, K key, V value, int bucketIndex) {
         if ((size >= threshold) && ( null != table[bucketIndex])) {
             resize( 2 * table.length);
             hash = ( null != key) ? hash(key) : 0 ;
             bucketIndex = indexFor(hash, table.length);
         }
 
         createEntry(hash, key, value, bucketIndex);
     }

jdk7中resize,只有當 size>=threshold而且 table中的那個槽中已經有Entry時,纔會發生resize。即有可能雖然size>=threshold,可是必須等到每一個槽都至少有一個Entry時,纔會擴容。還有注意每次resize都會擴大一倍容量

JDK8中的HashMap

一直到JDK7爲止,HashMap的結構都是這麼簡單,基於一個數組以及多個鏈表的實現,hash值衝突的時候,就將對應節點以鏈表的形式存儲。

這樣子的HashMap性能上就抱有必定疑問,若是說成百上千個節點在hash時發生碰撞,存儲一個鏈表中,那麼若是要查找其中一個節點,那就不可避免的花費O(N)的查找時間,這將是多麼大的性能損失。這個問題終於在JDK8中獲得瞭解決。再最壞的狀況下,鏈表查找的時間複雜度爲O(n),而紅黑樹一直是O(logn),這樣會提升HashMap的效率。

JDK7中HashMap採用的是位桶+鏈表的方式,即咱們常說的散列鏈表的方式,而JDK8中採用的是位桶+鏈表/紅黑樹(有關紅黑樹請查看紅黑樹)的方式,也是非線程安全的。當某個位桶的鏈表的長度達到某個閥值的時候,這個鏈表就將轉換成紅黑樹。

JDK8中,當同一個hash值的節點數不小於8時,將再也不以單鏈表的形式存儲了,會被調整成一顆紅黑樹(上圖中null節點沒畫)。這就是JDK7與JDK8中HashMap實現的最大區別。

接下來,咱們來看下JDK8中HashMap的源碼實現。

JDK中Entry的名字變成了Node,緣由是和紅黑樹的實現TreeNode相關聯。

1
transient Node<K,V>[] table;

當衝突節點數不小於8-1時,轉換成紅黑樹。

1
static final int TREEIFY_THRESHOLD = 8 ;

以put方法在JDK8中有了很大的改變

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
public V put(K key, V value) {
         return putVal(hash(key), key, value, false , true );
  }
 
final V putVal( int hash, K key, V value, boolean onlyIfAbsent,
                    boolean evict) {
         Node<K,V>[] tab;
     Node<K,V> p;
     int n, i;
     //若是當前map中無數據,執行resize方法。而且返回n
         if ((tab = table) == null || (n = tab.length) == 0 )
             n = (tab = resize()).length;
      //若是要插入的鍵值對要存放的這個位置恰好沒有元素,那麼把他封裝成Node對象,放在這個位置上就完事了
         if ((p = tab[i = (n - 1 ) & hash]) == null )
             tab[i] = newNode(hash, key, value, null );
     //不然的話,說明這上面有元素
         else {
             Node<K,V> e; K k;
         //若是這個元素的key與要插入的同樣,那麼就替換一下,也完事。
             if (p.hash == hash &&
                 ((k = p.key) == key || (key != null && key.equals(k))))
                 e = p;
         //1.若是當前節點是TreeNode類型的數據,執行putTreeVal方法
             else if (p instanceof TreeNode)
                 e = ((TreeNode<K,V>)p).putTreeVal( this , tab, hash, key, value);
             else {
         //仍是遍歷這條鏈子上的數據,跟jdk7沒什麼區別
                 for ( int binCount = 0 ; ; ++binCount) {
                     if ((e = p.next) == null ) {
                         p.next = newNode(hash, key, value, null );
             //2.完成了操做後多作了一件事情,判斷,而且可能執行treeifyBin方法
                         if (binCount >= TREEIFY_THRESHOLD - 1 ) // -1 for 1st
                             treeifyBin(tab, hash);
                         break ;
                     }
                     if (e.hash == hash &&
                         ((k = e.key) == key || (key != null && key.equals(k))))
                         break ;
                     p = e;
                 }
             }
             if (e != null ) { // existing mapping for key
                 V oldValue = e.value;
                 if (!onlyIfAbsent || oldValue == null ) //true || --
                     e.value = value;
            //3.
                 afterNodeAccess(e);
                 return oldValue;
             }
         }
         ++modCount;
     //判斷閾值,決定是否擴容
         if (++size > threshold)
             resize();
         //4.
         afterNodeInsertion(evict);
         return null ;
     }

treeifyBin()就是將鏈表轉換成紅黑樹。

以前的indefFor()方法消失 了,直接用(tab.length-1)&hash,因此看到這個,表明的就是數組的下角標。

1
2
3
4
static final int hash(Object key) {
         int h;
         return (key == null ) ? 0 : (h = key.hashCode()) ^ (h >>> 16 );
     }
相關文章
相關標籤/搜索