面試官:併發下的 HashMap 爲何會引發死循環?

今天研讀Java併發容器和框架時,看到爲何要使用ConcurrentHashMap時,其中有一個緣由是:線程不安全的HashMap, HashMap在併發執行put操做時會引發死循環,是由於多線程會致使HashMap的Entry鏈表造成環形數據結構,查找時會陷入死循環。糾起緣由看了其餘的博客,都比較抽象,因此這裏以圖形的方式展現一下,但願支持!安全

(1)當往HashMap中添加元素時,會引發HashMap容器的擴容,原理再也不解釋,直接附源代碼,以下:數據結構

/** 
    * 
    * 往表中添加元素,若是插入元素以後,表長度不夠,便會調用resize方法擴容 
    */  
   void addEntry(int hash, K key, V value, int bucketIndex) {  
Entry<K,V> e = table[bucketIndex];  
       table[bucketIndex] = new Entry<K,V>(hash, key, value, e);  
       if (size++ >= threshold)  
           resize(2 * table.length);  
   }  
  
   /** 
    * resize()方法以下,重要的是transfer方法,把舊錶中的元素添加到新表中
    */  
   void resize(int newCapacity) {  
       Entry[] oldTable = table;  
       int oldCapacity = oldTable.length;  
       if (oldCapacity == MAXIMUM_CAPACITY) {  
           threshold = Integer.MAX_VALUE;  
           return;  
       }  
  
       Entry[] newTable = new Entry[newCapacity];  
       transfer(newTable);  
       table = newTable;  
       threshold = (int)(newCapacity * loadFactor);  
   }

(2)參考上面的代碼,便引入到了transfer方法,(引入重點)這就是HashMap併發時,會引發死循環的根本緣由所在,下面結合transfer的源代碼,說明一下產生死循環的原理,先列transfer代碼(這是裏JDK7的源偌),以下:多線程

/**
     * Transfers all entries from current table to newTable.
     */
    void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {
 
            while(null != e) {
                Entry<K,V> next = e.next;            ---------------------(1)
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity); 
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            } // while
 
        }
    }

(3)假設:併發

Map<Integer> map = new HashMap<Integer>(2);  // 只能放置兩個元素,其中的threshold爲1(表中只填充一個元素時),即插入元素爲1時就擴容(由addEntry方法中得知)
//放置2個元素 3 和 7,若要再放置元素8(經hash映射後不等於1)時,會引發擴容

假設放置結果圖以下:
在這裏插入圖片描述
如今有兩個線程A和B,都要執行put操做,即向表中添加元素,即線程A和線程B都會看到上面圖的狀態快照框架

執行順序以下:函數

執行一: 線程A執行到transfer函數中(1)處掛起(transfer函數代碼中有標註)。此時在線程A的棧中spa

e = 3
next = 7

執行二:線程B執行 transfer函數中的while循環,即會把原來的table變成新一table(線程B本身的棧中),再寫入到內存中。以下圖(假設兩個元素在新的hash函數下也會映射到同一個位置)
在這裏插入圖片描述
執行三:線程A解掛,接着執行(看到的還是舊錶),即從transfer代碼(1)處接着執行,當前的 e = 3, next = 7, 上面已經描述。線程

1.處理元素 3 , 將 3 放入 線程A本身棧的新table中(新table是處於線程A本身棧中,是線程私有的,不肥線程2的影響),處理3後的圖以下:
在這裏插入圖片描述
2.線程A再複製元素 7 ,當前 e = 7 ,而next值因爲線程 B 修改了它的引用,因此next 爲 3 ,處理後的新表以下圖
在這裏插入圖片描述
3.因爲上面取到的next = 3, 接着while循環,即當前處理的結點爲3, next就爲null ,退出while循環,執行完while循環後,新表中的內容以下圖:
在這裏插入圖片描述
4.當操做完成,執行查找時,會陷入死循環!code

相關文章
相關標籤/搜索