A:哈希表結構(鏈表散列:數組+鏈表)實現,結合數組和鏈表的優勢。當鏈表長度超過 8 時,鏈表轉換爲紅黑樹。java
transient Node<K,V>\[\] table;
HashMap 底層是 hash 數組和單向鏈表實現,數組中的每一個元素都是鏈表,由 Node 內部類(實現 Map.Entry接口)實現,HashMap 經過 put & get 方法存儲和獲取。面試
存儲對象時,將 K/V 鍵值傳給 put() 方法:算法
①、調用 hash(K) 方法計算 K 的 hash 值,而後結合數組長度,計算得數組下標;數組
②、調整數組大小(當容器中的元素個數大於 capacity * loadfactor 時,容器會進行擴容resize 爲 2n);安全
③、i.若是 K 的 hash 值在 HashMap 中不存在,則執行插入,若存在,則發生碰撞;數據結構
ii.若是 K 的 hash 值在 HashMap 中存在,且它們二者 equals 返回 true,則更新鍵值對;多線程
iii. 若是 K 的 hash 值在 HashMap 中存在,且它們二者 equals 返回 false,則插入鏈表的尾部(尾插法)或者紅黑樹中(樹的添加方式)。併發
(JDK 1.7 以前使用頭插法、JDK 1.8 使用尾插法)(注意:當碰撞致使鏈表大於 TREEIFY_THRESHOLD = 8 時,就把鏈表轉換成紅黑樹)函數
獲取對象時,將 K 傳給 get() 方法:①、調用 hash(K) 方法(計算 K 的 hash 值)從而獲取該鍵值所在鏈表的數組下標;②、順序遍歷鏈表,equals()方法查找相同 Node 鏈表中 K 值對應的 V 值。性能
hashCode 是定位的,存儲位置;equals是定性的,比較二者是否相等。
由於 hashCode 相同,不必定就是相等的(equals方法比較),因此兩個對象所在數組的下標相同,"碰撞"就此發生。又由於 HashMap 使用鏈表存儲對象,這個 Node 會存儲到鏈表中。
JDK 1.8 中,是經過 hashCode() 的高 16 位異或低 16 位實現的:(h = k.hashCode()) ^ (h >>> 16),主要是從速度,功效和質量來考慮的,減小系統的開銷,也不會形成由於高位沒有參與下標的計算,從而引發的碰撞。
保證了對象的 hashCode 的 32 位值只要有一位發生改變,整個 hash() 返回值就會改變。儘量的減小碰撞。
①、table 數組大小是由 capacity 這個參數肯定的,默認是16,也能夠構造時傳入,最大限制是1<<30;
②、loadFactor 是裝載因子,主要目的是用來確認table 數組是否須要動態擴展,默認值是0.75,好比table 數組大小爲 16,裝載因子爲 0.75 時,threshold 就是12,當 table 的實際大小超過 12 時,table就須要動態擴容;
③、擴容時,調用 resize() 方法,將 table 長度變爲原來的兩倍(注意是 table 長度,而不是 threshold)
④、若是數據很大的狀況下,擴展時將會帶來性能的損失,在性能要求很高的地方,這種損失極可能很致命。
答:「調用哈希函數獲取Key對應的hash值,再計算其數組下標;
若是沒有出現哈希衝突,則直接放入數組;若是出現哈希衝突,則以鏈表的方式放在鏈表後面;
若是鏈表長度超過閥值( TREEIFY THRESHOLD==8),就把鏈表轉成紅黑樹,鏈表長度低於6,就把紅黑樹轉回鏈表;
若是結點的key已經存在,則替換其value便可;
若是集合中的鍵值對大於12,調用resize方法進行數組擴容。」
建立一個新的數組,其容量爲舊數組的兩倍,並從新計算舊數組中結點的存儲位置。結點在新數組中的位置只有兩種,原下標位置或原下標+舊數組的大小。
之因此選擇紅黑樹是爲了解決二叉查找樹的缺陷,二叉查找樹在特殊狀況下會變成一條線性結構(這就跟原來使用鏈表結構同樣了,形成很深的問題),遍歷查找會很是慢。推薦:面試問紅黑樹,我臉都綠了。
而紅黑樹在插入新數據後可能須要經過左旋,右旋、變色這些操做來保持平衡,引入紅黑樹就是爲了查找數據快,解決鏈表查詢深度的問題,咱們知道紅黑樹屬於平衡二叉樹,可是爲了保持「平衡」是須要付出代價的,可是該代價所損耗的資源要比遍歷線性鏈表要少,因此當長度大於8的時候,會使用紅黑樹,若是鏈表長度很短的話,根本不須要引入紅黑樹,引入反而會慢。
在java 1.8中,若是鏈表的長度超過了8,那麼鏈表將轉換爲紅黑樹。(桶的數量必須大於64,小於64的時候只會擴容)
發生hash碰撞時,java 1.7 會在鏈表的頭部插入,而java 1.8會在鏈表的尾部插入
在java 1.8中,Entry被Node替代(換了一個馬甲。
LinkedHashMap 保存了記錄的插入順序,在用 Iterator 遍歷時,先取到的記錄確定是先插入的;遍歷比 HashMap 慢;
TreeMap 實現 SortMap 接口,可以把它保存的記錄根據鍵排序(默認按鍵值升序排序,也能夠指定排序的比較器)
通常狀況下,使用最多的是 HashMap。
HashMap:在 Map 中插入、刪除和定位元素時;
TreeMap:在須要按天然順序或自定義順序遍歷鍵的狀況下;
LinkedHashMap:在須要輸出的順序和輸入的順序相同的狀況下。
①、HashMap 是線程不安全的,HashTable 是線程安全的;
②、因爲線程安全,因此 HashTable 的效率比不上 HashMap;
③、HashMap最多隻容許一條記錄的鍵爲null,容許多條記錄的值爲null,而 HashTable不容許;
④、HashMap 默認初始化數組的大小爲16,HashTable 爲 11,前者擴容時,擴大兩倍,後者擴大兩倍+1;
⑤、HashMap 須要從新計算 hash 值,而 HashTable 直接使用對象的 hashCode
ConcurrentHashMap 類(是 Java併發包 java.util.concurrent 中提供的一個線程安全且高效的 HashMap 實現)。
HashTable 是使用 synchronize 關鍵字加鎖的原理(就是對對象加鎖);
而針對 ConcurrentHashMap,在 JDK 1.7 中採用 分段鎖的方式;JDK 1.8 中直接採用了CAS(無鎖算法)+ synchronized。
除了加鎖,原理上無太大區別。另外,HashMap 的鍵值對容許有null,可是ConCurrentHashMap 都不容許。
HashTable 使用一把鎖(鎖住整個鏈表結構)處理併發問題,多個線程競爭一把鎖,容易阻塞;
ConcurrentHashMap
JDK 1.7 中,採用分段鎖的機制,實現併發的更新操做,底層採用數組+鏈表的存儲結構,包括兩個核心靜態內部類 Segment 和 HashEntry。
①、Segment 繼承 ReentrantLock(重入鎖) 用來充當鎖的角色,每一個 Segment 對象守護每一個散列映射表的若干個桶;
②、HashEntry 用來封裝映射表的鍵-值對;
③、每一個桶是由若干個 HashEntry 對象連接起來的鏈表
JDK 1.8 中,採用Node + CAS + Synchronized來保證併發安全。取消類 Segment,直接用 table 數組存儲鍵值對;當 HashEntry 對象組成的鏈表長度超過 TREEIFY_THRESHOLD 時,鏈表轉換爲紅黑樹,提高性能。底層變動爲數組 + 鏈表 + 紅黑樹。
①、粒度下降了;
②、JVM 開發團隊沒有放棄 synchronized,並且基於 JVM 的 synchronized 優化空間更大,更加天然。
③、在大量的數據操做下,對於 JVM 的內存壓力,基於 API 的 ReentrantLock 會開銷更多的內存。
①、重要的常量:
private transient volatile int sizeCtl;
當爲負數時,-1 表示正在初始化,-N 表示 N - 1 個線程正在進行擴容;
當爲 0 時,表示 table 尚未初始化;
當爲其餘正數時,表示初始化或者下一次進行擴容的大小。
②、數據結構:
Node 是存儲結構的基本單元,繼承 HashMap 中的 Entry,用於存儲數據;
TreeNode 繼承 Node,可是數據結構換成了二叉樹結構,是紅黑樹的存儲結構,用於紅黑樹中存儲數據;
TreeBin 是封裝 TreeNode 的容器,提供轉換紅黑樹的一些條件和鎖的控制。
③、存儲對象時(put() 方法):
若是沒有初始化,就調用 initTable() 方法來進行初始化;
若是沒有 hash 衝突就直接 CAS 無鎖插入;
若是須要擴容,就先進行擴容;
若是存在 hash 衝突,就加鎖來保證線程安全,兩種狀況:一種是鏈表形式就直接遍歷到尾端插入,一種是紅黑樹就按照紅黑樹結構插入;
若是該鏈表的數量大於閥值 8,就要先轉換成紅黑樹的結構,break 再一次進入循環
若是添加成功就調用 addCount() 方法統計 size,而且檢查是否須要擴容。
④、擴容方法 transfer():默認容量爲 16,擴容時,容量變爲原來的兩倍。
helpTransfer():調用多個工做線程一塊兒幫助進行擴容,這樣的效率就會更高。
⑤、獲取對象時(get()方法):
計算 hash 值,定位到該 table 索引位置,若是是首結點符合就返回;
若是遇到擴容時,會調用標記正在擴容結點 ForwardingNode.find()方法,查找該結點,匹配就返回;
以上都不符合的話,就往下遍歷結點,匹配就返回,不然最後就返回 null。
程序運行時可以同時更新 ConccurentHashMap 且不產生鎖競爭的最大線程數。默認爲 16,且能夠在構造函數中設置。
當用戶設置併發度時,ConcurrentHashMap 會使用大於等於該值的最小2冪指數做爲實際併發度(假如用戶設置併發度爲17,實際併發度則爲32)
原做者:菜鳥小於
原文連接: [HashMap面試必問的數據結構相關知識總結 - 菜鳥小於 - 博客園][HashMap_ - _ -]
原出處:博客園
侵刪
關注公衆號:java寶典