【Java 容器面試題】談談你對HashMap 的理解

  爲了可以在面試回答中優雅而不失體面回答面試考點,該文章借鑑了不一樣平臺對知識點的描述。node

  • 若有侵權請聯繫我
  • 文章的不足和錯誤請指正,好的建議也不要吝嗇,我都會採納並更正
  • 您的點贊是我持續更新的動力

個人回答

HashMap 是一種存取高效但不保證有序的經常使用容器。它的數據結構爲「數組+鏈表」,是解決哈希衝突的產物,也就是咱們常說的鏈地址法。它實現了Map 接口採用K-V 鍵值對存儲數據,並實現了淺拷貝和序列化。面試

HashMap 的默認初始大小爲16,初始化大小必須爲2的冪,最大大小爲2的30次方。數組中存儲的鏈表節點Entry 類實現於Map.Entry 接口,它實現了對節點的通用操做。HashMap 的閾值默認爲「容量*0.75f」,當存儲節點數量超過該值,則對map 進行擴容處理。算法

HashMap 提供了4種構造方法,分別是默認構造方法;能夠指定初始容量的構造方法;能夠指定初始容量和閾值的構造方法以及基於一個Map 的構造方法。雖然是構造函數,可是真正的初始化都是在第一次添加操做裏面實現的數組

在第一次添加操做中,HashMap 會先判斷存儲數組有沒有初始化,若是沒有先進行初始化操做,初始化過程當中會取比用戶指定的容量大的最近的2 的冪次方數做爲數組的初始容量,並更新擴容的閾值安全

接着添加操做講吧。添加操做的執行流程爲:數據結構

  • 先判斷有沒有初始化
  • 再判斷傳入的key 是否爲空,爲空保存在table[o] 位置
  • key 不爲空就對key 進hash,hash 的結果再& 數組的長度就獲得存儲的位置
  • 若是存儲位置爲空則建立節點,不爲空就說明存在衝突
  • 解決衝突HashMap 會先遍歷鏈表,若是有相同的value 就更新舊值,不然構建節點添加到鏈表頭
  • 添加還要先判斷存儲的節點數量是否達到閾值,到達閾值要進行擴容
  • 擴容擴2倍,是新建數組因此要先轉移節點,轉移時都從新計算存儲位置,可能保持不變可能爲舊容量+位置。
  • 擴容結束後新插入的元素也得再hash 一遍才能插入。

獲取節點的操做和添加差很少,也是併發

  • 先判斷是否爲空,爲空就在table[0] 去找值
  • 不爲空也是先hash,&數組長度計算下標位置
  • 再遍歷找相同的key 返回值

HashMap 的其餘操做大同小異,再講講HashMap1.7 的問題還有1.7 和1.8 的差異。函數

HashMap 是一個併發不安全的容器,在迭代操做是採用的是fast-fail 機制;在併發添加操做中會出現丟失更新的問題;由於採用頭插法在併發擴容時會產生環形鏈表的問題,致使CPU 到達100%,甚至宕機。工具

解決併發問題能夠採用.net

  • Java 類庫提供的Collections 工具包下的Collections.synchronizedMap()方法,返回一個線程安全的Map
  • 或者使用併發包下的 ConcurrentHashMap,ConcurrentHashMap採用分段鎖機制實現線程安全
  • 使用HashTable (不推薦)

Hash1.7 和1.8 最大的不一樣在於1.8 採用了「數組+鏈表+紅黑樹」的數據結構,在鏈表長度超過8 時,把鏈表轉化成紅黑樹來解決HashMap 因鏈表變長而查詢變慢的問題;其次

  • 在hash 取下標時將1.7 的9次擾動(5次按位與和4次位運算)改成2次(一次按位與和一次位運算)
  • 1.7 的底層節點爲Entry,1.8 爲node ,可是本質同樣,都是Map.Entry 的實現
  • 還有就是在存取數據時添加了關於樹結構的遍歷更新與添加操做,並採用了尾插法來避免環形鏈表的產生
  • 可是併發丟失更新的問題依然存在。

回答順序:數據結構+繼承結構+基本字段+構造方法+添加操做+擴容操做+獲取操做+併發問題+與1.8的區別

考點分析

HashMap 做爲最基本的容器,它自己的設計與1.7 1.8的差別性致使HashMap 成爲面試中最最高頻的考點。因此掌握HashMap 勢在必行,可是想要在各類寬泛的回答中脫穎而出,就必須對hashMap 來龍去脈瞭然於胸。

考點一:爲何初始容量必須爲2 的冪?爲何負載因子爲0.75f?爲何要作那麼多擾動處理?

這些問題都要圍繞一個點來回答:減小哈希衝突

(1)容量必須爲2 的冪是爲了增長取值的可能性。

2 的n次冪轉化爲二進制爲1後面n個0,在計算下標的時候是hash&(length - 1),也就是&(n-1)個1:初始容量爲4->100,length-1 -> 11。全部的二進制爲都爲1有什麼好處?

  • 0/1 & 1 都爲它自己
  • 0/1 & 0 都爲 0

能夠看出&1保證了取值的平均。若是某一位爲0 ,好比最後一位,那麼它&出來下標就必定是個偶數,減小了HashMap 數組一半的取值,大大增長了衝突的可能。

(2)負載因子爲0.75f 是空間與時間的均衡

  • 若是負載因子小,意味着閾值變小。好比容量爲10 的HashMap,負載因子爲0.5f,那麼存儲5個就會擴容到20,出現哈希衝突的可能性變小,可是空間利用率不高。適用於有足夠內存並要求查詢效率的場景。
  • 相反若是閾值爲1 ,那麼容量爲10,就必須存儲10個元素才進行擴容,出現衝突的機率變大,極端狀況下可能會從O(1)退化到O(n)。適用於內存敏感但不要求要求查詢效率的場景

(3)hash() 的意義在於使hash 結果不一樣 hash 算法的好壞直接影響hash 結構的效率,壞的hash 算法極端狀況下可能會使hash 結構的存取效率從O(1)退化到O(n)。1.8 之因此把9 次擾動降到2 次,是出於計算效率的考慮。

考點二:& 字符雖然和 % 效果同樣,可是操做效率更高

考點三:爲何int,String 適合最爲key?

int 和 String 的好處在於hash 出來的值不會改變。若是是一個對象,那麼他們可能會由於內部引用的改變而hashCode 值的改變,會致使存儲重複的數據或找不到數據的狀況。

考點四:併發操做致使的添加丟失和環形鏈表的產生過程

知識點拓展

不只僅是HashMap 的東西,根據你的回答,面試官會引出不少其餘的問題,因此你在本身設計回答的過程當中能夠有意識引導面試官問出你熟悉的內容,安排的明明白白。

拓展一:解決Hash 衝突的不一樣方案

  • 鏈地址法
  • 開發地址:線性探測法、平方探測法
  • 徹底散列:布穀鳥散列

拓展二:HashMap 是淺拷貝,說一說淺拷貝和深拷貝的區別

拓展三:說一說Collections.synchronizedMap()和HashTable 的區別

拓展四:說一說HashMap 如何實現有序(LinkHashMap 和TreeMap)以及他們的差異

拓展五:說一說ConcurrentHashMap 如何實現線程安全

結尾

這篇文章更多的是HashMap 面試怎麼答,以及須要注意的知識點,但願對你有所幫助。

HashMap 的東西太多,因我的能力有限不能一一道全,後面若是變強了我會從新補全

推薦一篇關於HashMap 1.8 的比較好的博客: HashMap 1.8 重大更新

相關文章
相關標籤/搜索