咱們都知道HashMap是線程不安全的,在多線程環境中不建議使用,可是其線程不安全主要體如今什麼地方呢,本文將對該問題進行解密。算法
1.jdk1.7中的HashMap
在jdk1.8中對HashMap作了不少優化,這裏先分析在jdk1.7中的問題,相信你們都知道在jdk1.7多線程環境下HashMap容易出現死循環,這裏咱們先用代碼來模擬出現死循環的狀況:數組
public static void main(String[] args) { HashMapThread thread0 = new HashMapThread(); HashMapThread thread1 = new HashMapThread(); HashMapThread thread2 = new HashMapThread(); HashMapThread thread3 = new HashMapThread(); HashMapThread thread4 = new HashMapThread(); thread0.start(); thread1.start(); thread2.start(); thread3.start(); thread4.start(); } } class HashMapThread extends Thread { private static AtomicInteger ai = new AtomicInteger(); private static Map<integer, integer="" style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important;">map = new HashMap<>(); @Override public void run() { while (ai.get() < 1000000) { map.put(ai.get(), ai.get()); ai.incrementAndGet(); } } }</integer,>
上述代碼比較簡單,就是開多個線程不斷進行put操做,而且HashMap與AtomicInteger都是全局共享的。安全
在多運行幾回該代碼後,出現以下死循環情形:
數據結構
其中有幾回還會出現數組越界的狀況:
多線程
這裏咱們着重分析爲何會出現死循環的狀況,經過jps和jstack命名查看死循環狀況,結果以下:
app
從堆棧信息中能夠看到出現死循環的位置,經過該信息可明確知道死循環發生在HashMap的擴容函數中,根源在transfer函數中,jdk1.7中HashMap的transfer函數以下:ide
void transfer(Entry[] newTable, boolean rehash) { int newCapacity = newTable.length; for (Entry<k,v style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important;">e : table) { while(null != e) { Entry<k,v style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important;">next = e.next; if (rehash) { e.hash = null == e.key ? 0 : hash(e.key); } int i = indexFor(e.hash, newCapacity); e.next = newTable[i]; newTable[i] = e; e = next; } } }</k,v></k,v>
都說知道 HashMap 線程不安全,那它爲啥就不安全?
Java領域佼佼者 2020-02-20 14:40
咱們都知道HashMap是線程不安全的,在多線程環境中不建議使用,可是其線程不安全主要體如今什麼地方呢,本文將對該問題進行解密。函數
1.jdk1.7中的HashMap
在jdk1.8中對HashMap作了不少優化,這裏先分析在jdk1.7中的問題,相信你們都知道在jdk1.7多線程環境下HashMap容易出現死循環,這裏咱們先用代碼來模擬出現死循環的狀況:優化
public static void main(String[] args) {
HashMapThread thread0 = new HashMapThread();
HashMapThread thread1 = new HashMapThread();
HashMapThread thread2 = new HashMapThread();
HashMapThread thread3 = new HashMapThread();
HashMapThread thread4 = new HashMapThread();
thread0.start();
thread1.start();
thread2.start();
thread3.start();
thread4.start();
}
}this
class HashMapThread extends Thread {
private static AtomicInteger ai = new AtomicInteger();
private static Map<integer, integer="" style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important;">map = new HashMap<>();
@Override
public void run() {
while (ai.get() < 1000000) {
map.put(ai.get(), ai.get());
ai.incrementAndGet();
}
}
}</integer,>
上述代碼比較簡單,就是開多個線程不斷進行put操做,而且HashMap與AtomicInteger都是全局共享的。
在多運行幾回該代碼後,出現以下死循環情形:
其中有幾回還會出現數組越界的狀況:
這裏咱們着重分析爲何會出現死循環的狀況,經過jps和jstack命名查看死循環狀況,結果以下:
從堆棧信息中能夠看到出現死循環的位置,經過該信息可明確知道死循環發生在HashMap的擴容函數中,根源在transfer函數中,jdk1.7中HashMap的transfer函數以下:
void transfer(Entry[] newTable, boolean rehash) {
int newCapacity = newTable.length;
for (Entry<k,v style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important;">e : table) {
while(null != e) {
Entry<k,v style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important;">next = e.next;
if (rehash) {
e.hash = null == e.key ? 0 : hash(e.key);
}
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e;
e = next;
}
}
}</k,v></k,v>
總結下該函數的主要做用:
在對table進行擴容到newTable後,須要將原來數據轉移到newTable中,注意10-12行代碼,這裏能夠看出在轉移元素的過程當中,使用的是頭插法,也就是鏈表的順序會翻轉,這裏也是造成死循環的關鍵點。
下面進行詳細分析。
1.1 擴容形成死循環分析過程
前提條件,這裏假設:
hash算法爲簡單的用key mod鏈表的大小。最開始hash表size=2,key=3,7,5,則都在table[1]中。而後進行resize,使size變成4。
未resize前的數據結構以下:
若是在單線程環境下,最後的結果以下:
這裏的轉移過程,再也不進行詳述,只要理解transfer函數在作什麼,其轉移過程以及如何對鏈表進行反轉應該不難。
而後在多線程環境下,假設有兩個線程A和B都在進行put操做。線程A在執行到transfer函數中第11行代碼處掛起,由於該函數在這裏分析的地位很是重要,所以再次貼出來。
此時線程A中運行結果以下:
線程A掛起後,此時線程B正常執行,並完成resize操做,結果以下:
這裏須要特別注意的點:因爲線程B已經執行完畢,根據Java內存模型,如今newTable和table中的Entry都是主存中最新值:****7.next=3,3.next=null。
此時切換到線程A上,在線程A掛起時內存中值以下:e=3,next=7,newTable[3]=null,代碼執行過程以下:
newTable[3]=e ----> newTable[3]=3 e=next ----> e=7
此時結果以下:
繼續循環:
e=7 next=e.next ----> next=3【從主存中取值】 e.next=newTable[3] ----> e.next=3【從主存中取值】 newTable[3]=e ----> newTable[3]=7 e=next ----> e=3
結果以下:
再次進行循環:
e=3 next=e.next ----> next=null e.next=newTable[3] ----> e.next=7 即:3.next=7 newTable[3]=e ----> newTable[3]=3 e=next ----> e=null
注意這次循環:e.next=7,而在上次循環中7.next=3,出現環形鏈表,而且此時e=null循環結束。
結果以下:
在後續操做中只要涉及輪詢hashmap的數據結構,就會在這裏發生死循環,形成悲劇。
1.2 擴容形成數據丟失分析過程
遵守上述分析過程,初始時:
線程A和線程B進行put操做,一樣線程A掛起:
此時線程A的運行結果以下:
此時線程B已得到CPU時間片,並完成resize操做:
一樣注意因爲線程B執行完成,newTable和table都爲最新值:5.next=null。
此時切換到線程A,在線程A掛起時:e=7,next=5,newTable[3]=null。
執行newtable[i]=e,就將7放在了table[3]的位置,此時next=5。接着進行下一次循環:
e=5 next=e.next ----> next=null,從主存中取值 e.next=newTable[1] ----> e.next=5,從主存中取值 newTable[1]=e ----> newTable[1]=5 e=next ----> e=null
將5放置在table[1]位置,此時e=null循環結束,3元素丟失,並造成環形鏈表。並在後續操做hashmap時形成死循環。
2.jdk1.8中HashMap
在jdk1.8中對HashMap進行了優化,在發生hash碰撞,再也不採用頭插法方式,而是直接插入鏈表尾部,所以不會出現環形鏈表的狀況,可是在多線程的狀況下仍然不安全,這裏咱們看jdk1.8中HashMap的put操做源碼:
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node<k,v style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important;">[] tab; Node<k,v style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important;">p; int n, i; if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; if ((p = tab[i = (n - 1) & hash]) == null) // 若是沒有hash碰撞則直接插入元素 tab[i] = newNode(hash, key, value, null); else { Node<k,v style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important;">e; K k; if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; else if (p instanceof TreeNode) e = ((TreeNode<k,v style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important;">)p).putTreeVal(this, tab, hash, key, value); else { for (int binCount = 0; ; ++binCount) { if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; } } if (e != null) { // existing mapping for key V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue; } } ++modCount; if (++size > threshold) resize(); afterNodeInsertion(evict); return null; }</k,v></k,v></k,v></k,v>
這是jdk1.8中HashMap中put操做的主函數, 注意第6行代碼,若是沒有hash碰撞則會直接插入元素。
若是線程A和線程B同時進行put操做,恰好這兩條不一樣的數據hash值同樣,而且該位置數據爲null,因此這線程A、B都會進入第6行代碼中。
假設一種狀況,線程A進入後還未進行數據插入時掛起,而線程B正常執行,從而正常插入數據,而後線程A獲取CPU時間片,此時線程A不用再進行hash判斷了,問題出現:線程A會把線程B插入的數據給覆蓋,發生線程不安全。
總結
首先HashMap是線程不安全的,其主要體現:
在jdk1.7中,在多線程環境下,擴容時會形成環形鏈或數據丟失。在jdk1.8中,在多線程環境下,會發生數據覆蓋的狀況。