Go語言map的底層實現

map是Go語言中基礎的數據結構,在平常的使用中常常被用到。可是它底層是如何實現的呢?數組

map的總體結構圖

Golang中map的底層實現是一個散列表,所以實現map的過程實際上就是實現散表的過程。在這個散列表中,主要出現的結構體有兩個,一個叫hmap(a header for a go map),一個叫bucket。這兩種結構的樣子分別以下所示:bash

hmap:微信

圖中有不少字段,可是便於理解map的架構,你只須要關心的只有一個,就是標紅的字段:buckets數組。Golang的map中用於存儲的結構是bucket數組。而bucket(即bmap)的結構是怎樣的呢?數據結構

bucket:架構

相比於hmap,bucket的結構顯得簡單一些,標紅的字段依然是「核心」,咱們使用的map中的key和value就存儲在這裏。「高位哈希值」數組記錄的是當前bucket中key相關的「索引」,稍後會詳細敘述。還有一個字段是一個指向擴容後的bucket的指針,使得bucket會造成一個鏈表結構。例以下圖:函數

由此看出hmapbucket的關係是這樣的:spa

這裏寫圖片描述

而bucket又是一個鏈表,因此,總體的結構應該是這樣的:3d

這裏寫圖片描述

哈希表的特色是會有一個哈希函數,對你傳來的key進行哈希運算,獲得惟一的值,通常狀況下都是一個數值。Golang的map中也有這麼一個哈希函數,也會算出惟一的值,對於這個值的使用,Golang也是頗有意思。指針

Golang把求得的值按照用途一分爲二:高位和低位。code

這裏寫圖片描述

如圖所示,藍色爲高位,紅色爲低位。 而後低位用於尋找當前key屬於hmap中的哪一個bucket,而高位用於尋找bucket中的哪一個key。上文中提到:bucket中有個屬性字段是「高位哈希值」數組,這裏存的就是藍色的高位值,用來聲明當前bucket中有哪些「key」,便於搜索查找。 須要特別指出的一點是:咱們map中的key/value值都是存到同一個數組中的。數組中的順序是這樣的:

這裏寫圖片描述

並非key0/value0/key1/value1的形式,這樣作的好處是:在key和value的長度不一樣的時候,能夠消除padding帶來的空間浪費。

如今,咱們能夠獲得Go語言map的整個的結構圖了:

這裏寫圖片描述

以上,就是Go語言map的總體結構了。

map的擴容

當以上的哈希表增加的時候,Go語言會將bucket數組的數量擴充一倍,產生一個新的bucket數組,並將舊數組的數據遷移至新數組。

加載因子

判斷擴充的條件,就是哈希表中的加載因子(即loadFactor)。

加載因子是一個閾值,通常表示爲:散列包含的元素數 除以 位置總數。是一種「產生衝突機會」和「空間使用」的平衡與折中:加載因子越小,說明空間空置率高,空間使用率小,可是加載因子越大,說明空間利用率上去了,可是「產生衝突機會」高了。

每種哈希表的都會有一個加載因子,數值超過加載因子就會爲哈希表擴容。 Golang的map加載因子的公式是:map長度 / 2^B閾值是6.5。其中B能夠理解爲已擴容的次數。

當Go的map長度增加到大於加載因子所需的map長度時,Go語言就會將產生一個新的bucket數組,而後把舊的bucket數組移到一個屬性字段oldbucket中。注意:並非馬上把舊的數組中的元素轉義到新的bucket當中,而是,只有當訪問到具體的某個bucket的時候,會把bucket中的數據轉移到新的bucket中。

以下圖所示:當擴容的時候,Go的map結構體中,會保存舊的數據,和新生成的數組

這裏寫圖片描述

上面部分表明舊的有數據的bucket,下面部分表明新生成的新的bucket。藍色表明存有數據的bucket,橘黃色表明空的bucket。 擴容時map並不會當即把新數據作遷移,而是當訪問原來舊bucket的數據的時候,才把舊數據作遷移,以下圖:

這裏寫圖片描述

注意:這裏並不會直接刪除舊的bucket,而是把原來的引用去掉,利用GC清除內存。

map中數據的刪除

若是理解了map的總體結構,那麼查找、更新、刪除的基本步驟應該都很清楚了。這裏再也不贅述。 值得注意的是,找到了map中的數據以後,針對key和value分別作以下操做:

一、若是``key``是一個指針類型的,則直接將其置爲空,等待GC清除;
二、若是是值類型的,則清除相關內存。
三、同理,對``value``作相同的操做。
四、最後把key對應的高位值對應的數組index置爲空。
複製代碼

更多精彩內容,請關注個人微信公衆號 互聯網技術窩 或者加微信共同探討交流:

相關文章
相關標籤/搜索