HashMap連環問你能答出幾道?

時間 2021-02-24

標籤 java 面試算法數組安全數據結構多線程併發函數性能欄目 Java 简体版

原文原文鏈接

1：HashMap 的數據結構？

A：哈希表結構（鏈表散列：數組+鏈表）實現，結合數組和鏈表的優勢。當鏈表長度超過 8 時，鏈表轉換爲紅黑樹。java

transient Node<K,V>\[\] table;

2：HashMap 的工做原理？

HashMap 底層是 hash 數組和單向鏈表實現，數組中的每一個元素都是鏈表，由 Node 內部類（實現 Map.Entry接口）實現，HashMap 經過 put & get 方法存儲和獲取。面試

存儲對象時，將 K/V 鍵值傳給 put() 方法：算法

①、調用 hash(K) 方法計算 K 的 hash 值，而後結合數組長度，計算得數組下標；數組

②、調整數組大小（當容器中的元素個數大於 capacity * loadfactor 時，容器會進行擴容resize 爲 2n）；安全

③、i.若是 K 的 hash 值在 HashMap 中不存在，則執行插入，若存在，則發生碰撞；數據結構

ii.若是 K 的 hash 值在 HashMap 中存在，且它們二者 equals 返回 true，則更新鍵值對；多線程

iii. 若是 K 的 hash 值在 HashMap 中存在，且它們二者 equals 返回 false，則插入鏈表的尾部（尾插法）或者紅黑樹中（樹的添加方式）。併發

（JDK 1.7 以前使用頭插法、JDK 1.8 使用尾插法）（注意：當碰撞致使鏈表大於 TREEIFY_THRESHOLD = 8 時，就把鏈表轉換成紅黑樹）函數

獲取對象時，將 K 傳給 get() 方法：①、調用 hash(K) 方法（計算 K 的 hash 值）從而獲取該鍵值所在鏈表的數組下標；②、順序遍歷鏈表，equals()方法查找相同 Node 鏈表中 K 值對應的 V 值。性能

hashCode 是定位的，存儲位置；equals是定性的，比較二者是否相等。

3.當兩個對象的 hashCode 相同會發生什麼？

由於 hashCode 相同，不必定就是相等的（equals方法比較），因此兩個對象所在數組的下標相同，"碰撞"就此發生。又由於 HashMap 使用鏈表存儲對象，這個 Node 會存儲到鏈表中。

4.你知道 hash 的實現嗎？爲何要這樣實現？

JDK 1.8 中，是經過 hashCode() 的高 16 位異或低 16 位實現的：(h = k.hashCode()) ^ (h >>> 16)，主要是從速度，功效和質量來考慮的，減小系統的開銷，也不會形成由於高位沒有參與下標的計算，從而引發的碰撞。

5.爲何要用異或運算符？

保證了對象的 hashCode 的 32 位值只要有一位發生改變，整個 hash() 返回值就會改變。儘量的減小碰撞。

6.HashMap 的 table 的容量如何肯定？loadFactor 是什麼？該容量如何變化？這種變化會帶來什麼問題？

①、table 數組大小是由 capacity 這個參數肯定的，默認是16，也能夠構造時傳入，最大限制是1<<30；

②、loadFactor 是裝載因子，主要目的是用來確認table 數組是否須要動態擴展，默認值是0.75，好比table 數組大小爲 16，裝載因子爲 0.75 時，threshold 就是12，當 table 的實際大小超過 12 時，table就須要動態擴容；

③、擴容時，調用 resize() 方法，將 table 長度變爲原來的兩倍（注意是 table 長度，而不是 threshold）

④、若是數據很大的狀況下，擴展時將會帶來性能的損失，在性能要求很高的地方，這種損失極可能很致命。

7.HashMap中put方法的過程？

答：「調用哈希函數獲取Key對應的hash值，再計算其數組下標；

若是沒有出現哈希衝突，則直接放入數組；若是出現哈希衝突，則以鏈表的方式放在鏈表後面；

若是鏈表長度超過閥值( TREEIFY THRESHOLD==8)，就把鏈表轉成紅黑樹，鏈表長度低於6，就把紅黑樹轉回鏈表;

若是結點的key已經存在，則替換其value便可；

若是集合中的鍵值對大於12，調用resize方法進行數組擴容。」

8.數組擴容的過程？

建立一個新的數組，其容量爲舊數組的兩倍，並從新計算舊數組中結點的存儲位置。結點在新數組中的位置只有兩種，原下標位置或原下標+舊數組的大小。

9.拉鍊法致使的鏈表過深問題爲何不用二叉查找樹代替，而選擇紅黑樹？爲何不一直使用紅黑樹？

之因此選擇紅黑樹是爲了解決二叉查找樹的缺陷，二叉查找樹在特殊狀況下會變成一條線性結構（這就跟原來使用鏈表結構同樣了，形成很深的問題），遍歷查找會很是慢。推薦：面試問紅黑樹，我臉都綠了。

而紅黑樹在插入新數據後可能須要經過左旋，右旋、變色這些操做來保持平衡，引入紅黑樹就是爲了查找數據快，解決鏈表查詢深度的問題，咱們知道紅黑樹屬於平衡二叉樹，可是爲了保持「平衡」是須要付出代價的，可是該代價所損耗的資源要比遍歷線性鏈表要少，因此當長度大於8的時候，會使用紅黑樹，若是鏈表長度很短的話，根本不須要引入紅黑樹，引入反而會慢。

10.說說你對紅黑樹的看法？

每一個節點非紅即黑
根節點老是黑色的
若是節點是紅色的，則它的子節點必須是黑色的（反之不必定）
每一個葉子節點都是黑色的空節點（NIL節點）
從根節點到葉節點或空子節點的每條路徑，必須包含相同數目的黑色節點（即相同的黑色高度）

11.jdk8中對HashMap作了哪些改變？

在java 1.8中，若是鏈表的長度超過了8，那麼鏈表將轉換爲紅黑樹。（桶的數量必須大於64，小於64的時候只會擴容）

發生hash碰撞時，java 1.7 會在鏈表的頭部插入，而java 1.8會在鏈表的尾部插入

在java 1.8中，Entry被Node替代(換了一個馬甲。

12.HashMap，LinkedHashMap，TreeMap 有什麼區別？

LinkedHashMap 保存了記錄的插入順序，在用 Iterator 遍歷時，先取到的記錄確定是先插入的；遍歷比 HashMap 慢；

TreeMap 實現 SortMap 接口，可以把它保存的記錄根據鍵排序（默認按鍵值升序排序，也能夠指定排序的比較器）

13.HashMap & TreeMap & LinkedHashMap 使用場景？

通常狀況下，使用最多的是 HashMap。

HashMap：在 Map 中插入、刪除和定位元素時；

TreeMap：在須要按天然順序或自定義順序遍歷鍵的狀況下；

LinkedHashMap：在須要輸出的順序和輸入的順序相同的狀況下。

14.HashMap 和 HashTable 有什麼區別？

①、HashMap 是線程不安全的，HashTable 是線程安全的；

②、因爲線程安全，因此 HashTable 的效率比不上 HashMap；

③、HashMap最多隻容許一條記錄的鍵爲null，容許多條記錄的值爲null，而 HashTable不容許；

④、HashMap 默認初始化數組的大小爲16，HashTable 爲 11，前者擴容時，擴大兩倍，後者擴大兩倍+1；

⑤、HashMap 須要從新計算 hash 值，而 HashTable 直接使用對象的 hashCode

15.Java 中的另外一個線程安全的與 HashMap 極其相似的類是什麼？一樣是線程安全，它與 HashTable 在線程同步上有什麼不一樣？

ConcurrentHashMap 類（是 Java併發包 java.util.concurrent 中提供的一個線程安全且高效的 HashMap 實現）。

HashTable 是使用 synchronize 關鍵字加鎖的原理（就是對對象加鎖）；

而針對 ConcurrentHashMap，在 JDK 1.7 中採用分段鎖的方式；JDK 1.8 中直接採用了CAS（無鎖算法）+ synchronized。

16.HashMap & ConcurrentHashMap 的區別？

除了加鎖，原理上無太大區別。另外，HashMap 的鍵值對容許有null，可是ConCurrentHashMap 都不容許。

17.爲何 ConcurrentHashMap 比 HashTable 效率要高？

HashTable 使用一把鎖（鎖住整個鏈表結構）處理併發問題，多個線程競爭一把鎖，容易阻塞；

ConcurrentHashMap

JDK 1.7 中使用分段鎖（ReentrantLock + Segment + HashEntry），至關於把一個 HashMap 分紅多個段，每段分配一把鎖，這樣支持多線程訪問。鎖粒度：基於 Segment，包含多個 HashEntry。
JDK 1.8 中使用 CAS + synchronized + Node + 紅黑樹。鎖粒度：Node（首結點）（實現 Map.Entry）。鎖粒度下降了。

18.針對 ConcurrentHashMap 鎖機制具體分析（JDK 1.7 VS JDK 1.8）

JDK 1.7 中，採用分段鎖的機制，實現併發的更新操做，底層採用數組+鏈表的存儲結構，包括兩個核心靜態內部類 Segment 和 HashEntry。

①、Segment 繼承 ReentrantLock（重入鎖）用來充當鎖的角色，每一個 Segment 對象守護每一個散列映射表的若干個桶；

②、HashEntry 用來封裝映射表的鍵-值對；

③、每一個桶是由若干個 HashEntry 對象連接起來的鏈表

JDK 1.8 中，採用Node + CAS + Synchronized來保證併發安全。取消類 Segment，直接用 table 數組存儲鍵值對；當 HashEntry 對象組成的鏈表長度超過 TREEIFY_THRESHOLD 時，鏈表轉換爲紅黑樹，提高性能。底層變動爲數組 + 鏈表 + 紅黑樹。