多線程下HashMap的死循環問題

多線程下[HashMap]的問題:

一、多線程put操做後,get操做致使死循環。
二、多線程put非NULL元素後,get操做獲得NULL值。
三、多線程put操做,致使元素丟失。html

本次主要關注[HashMap]-死循環問題。數組

爲什麼出現死循環?

你們都知道,HashMap採用鏈表解決Hash衝突,具體的HashMap的分析能夠參考一下Java集合---HashMap源碼剖析 的分析。由於是鏈表結構,那麼就很容易造成閉合的鏈路,這樣在循環的時候只要有線程對這個HashMap進行get操做就會產生死循環。可是,我好奇的是,這種閉合的鏈路是如何造成的呢。在單線程狀況下,只有一個線程對HashMap的數據結構進行操做,是不可能產生閉合的迴路的。那就只有在多線程併發的狀況下才會出現這種狀況,那就是在put操做的時候,若是size>initialCapacity*loadFactor,那麼這時候HashMap就會進行rehash操做,隨之HashMap的結構就會發生翻天覆地的變化。頗有可能就是在兩個線程在這個時候同時觸發了rehash操做,產生了閉合的迴路。數據結構

下面咱們從源碼中一步一步地分析這種迴路是如何產生的。先看一下put操做:多線程

存儲數據put

public V put(K key, V value) { ...... //算Hash值
    int hash = hash(key.hashCode()); int i = indexFor(hash, table.length); //若是該key已被插入,則替換掉舊的value (連接操做)
    for (Entry<K,V> e = table[i]; e != null; e = e.next) { Object k; if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { V oldValue = e.value; e.value = value; e.recordAccess(this); return oldValue; } } modCount++; //該key不存在,須要增長一個結點
 addEntry(hash, key, value, i); return null; }

當咱們往HashMap中put元素的時候,先根據key的hash值獲得這個元素在數組中的位置(即下標),而後就能夠把這個元素放到對應的位置中了。 若是這個元素所在的位置上已經存放有其餘元素了,那麼在同一個位子上的元素將以鏈表的形式存放,新加入的放在鏈頭,而先前加入的放在鏈尾。併發

檢查容量是否超標addEntry

能夠看到,若是如今size已經超過了threshold,那麼就要進行resize操做,新建一個更大尺寸的hash表,而後把數據從老的Hash表中遷移到新的Hash表中:this

調整Hash表大小resize

void resize(int newCapacity) { Entry[] oldTable = table; int oldCapacity = oldTable.length; ...... //建立一個新的Hash Table
    Entry[] newTable = new Entry[newCapacity]; //將Old Hash Table上的數據遷移到New Hash Table上
 transfer(newTable); table = newTable; threshold = (int)(newCapacity * loadFactor); }

當table[]數組容量較小,容易產生哈希碰撞,因此,Hash表的尺寸和容量很是的重要。通常來講,Hash表這個容器當有數據要插入時,都會檢查容量有沒有超過設定的thredhold,若是超過,須要增大Hash表的尺寸,這個過程稱爲resize。spa

多個線程同時往HashMap添加新元素時,屢次resize會有必定機率出現死循環,由於每次resize須要把舊的數據映射到新的哈希表,這一部分代碼在HashMap#transfer() 方法,以下:線程

void transfer(Entry[] newTable) { Entry[] src = table; int newCapacity = newTable.length; //下面這段代碼的意思是: // 從OldTable裏摘一個元素出來,而後放到NewTable中
    for (int j = 0; j < src.length; j++) { Entry<K,V> e = src[j]; if (e != null) { src[j] = null; do { Entry<K,V> next = e.next; int i = indexFor(e.hash, newCapacity); e.next = newTable[i]; newTable[i] = e; e = next; } while (e != null); } } }

綠色部分代碼是致使多線程使用hashmap出現CUP使用率驟增,從而多個線程阻塞的罪魁禍首。code

相關文章
相關標籤/搜索