Array、Slice、Map原理淺析

Array

數組(值類型),是用來存儲集合數據的,這種場景很是多,咱們編碼的過程當中,都少不了要讀取或者存儲數據。固然除了數組以外,咱們還有切片、Map映射等數據結構能夠幫咱們存儲數據,可是數組是它們的基礎。javascript

聲明和初始化

數組初始化的幾種方式java

a := [10]int{ 1, 2, 3, 4 } // 未提供初始化值的元素爲默認值 0
b := [...]int{ 1, 2 } // 由初始化列表決定數組⻓度,不能省略 "...",不然就成 slice 了。
c := [10]int{ 2:1, 5:100 } // 按序號初始化元素
複製代碼

數組⻓度下標 n 必須是編譯期正整數常量 (或常量表達式)。 ⻓度是類型的組成部分,也就是說 "[10]int" 和 "[20]int" 是徹底不一樣的兩種數組類型。數組

var a [20]int
var b [10]int
// 這裏會報錯,不一樣類型,沒法比較
fmt.Println(a == b)
複製代碼

數組是值類型,也就是說會拷⻉整個數組內存進⾏值傳遞。可⽤ slice 或指針代替。數據結構

func test(x *[4]int) {
  for i := 0; i < len(x); i++ {
    println(x[i])
  }
  x[3] = 300
}

// 取地址傳入
a := [10]int{ 1, 2, 3, 4 }
test(&a)

// 也能夠⽤ new() 建立數組,返回數組指針。
var a = new([10]int) // 返回指針。
test(a)
複製代碼

Slice

d

一個slice是一個數組某個部分的引用。在內存中,它是一個包含3個域的結構體:指向slice中第一個元素的指針,slice的長度,以及slice的容量。長度是下標操做的上界,如x[i]中i必須小於長度。容量是分割操做的上界,如x[i:j]中j不能大於容量。app

src/pkg/runtime/runtime.h函數

struct Slice {
  byte* array  // actual data
  uint32 len  // number of elements
  uint32 cap  // allocated number of elements
};
複製代碼

對 slice 的修改就是對底層數組的修改。ui

func main() {
	x := [...]int{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
	s := x[:6]
	s = append(s, 10)
	s[0] = 100
	fmt.Println(x)
	fmt.Println(s)
}
複製代碼

輸出編碼

[100 1 2 3 4 5 10 7 8 9]
[100 1 2 3 4 5 10]
複製代碼

可是當slice的len超出了原底層數組的cap的時候,此時就會新開闢一塊內存區域用來存儲新建的底層數組。spa

func main() {
	x := [...]int{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
	s := x[:]
	s = append(s, 10)
	s[0] = 100
	fmt.Println(x)
	fmt.Println(s)
}
複製代碼

輸出設計

[0 1 2 3 4 5 6 7 8 9]
[100 1 2 3 4 5 6 7 8 9 10]
複製代碼

d

函數 copy ⽤於在 slice 間複製數據,能夠是指向同⼀底層數組的兩個 slice。複製元素數量受限於src 和 dst 的 len 值 (二者的最⼩值)。在同⼀底層數組的不一樣 slice 間拷⻉時,元素位置能夠重疊。

func main() {
  s1 := []int{ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 }
  s2 := make([]int, 3, 20)
  var n int
  n = copy(s2, s1) // n = 3。不一樣數組上拷⻉。s2.len == 3,只能拷 3 個元素。
  fmt.Println(n, s2, len(s2), cap(s2)) // [0 1 2], len:3, cap:20
  s3 := s1[4:6] // s3 == [4 5]。s3 和 s1 指向同⼀個底層數組。
  n = copy(s3, s1[1:5]) // n = 2。同⼀數組上拷⻉,且存在重疊區域。
  fmt.Println(n, s1, s3) // [0 1 2 3 1 2 6 7 8 9] [1 2]
}
複製代碼

輸出

3 [0 1 2] 3 20
2 [0 1 2 3 1 2 6 7 8 9] [1 2]
複製代碼

數組的slice並不會實際複製一份數據,它只是建立一個新的數據結構,包含了另外的一個指針,一個長度和一個容量數據。 如同分割一個字符串,分割數組也不涉及複製操做:它只是新建了一個結構來放置一個不一樣的指針,長度和容量。

因爲slice是不一樣於指針的多字長結構,分割操做並不須要分配內存,甚至沒有一般被保存在堆中的slice頭部。這種表示方法使slice操做和在C中傳遞指針、長度對同樣廉價。

slice的擴容規則

在對slice進行append等操做時,可能會形成slice的自動擴容。其擴容時的大小增加規則是:

  • 若是新的大小是當前大小2倍以上,則大小增加爲新大小
  • 不然循環如下操做:若是當前大小小於1024,按每次2倍增加,不然每次按當前大小1/4增加。直到增加的大小超過或等於新大小。

make和new

Go有兩個數據結構建立函數:new和make。基本的區別是new(T)返回一個*T,返回的這個指針能夠被隱式地消除引用。而make(T, args)返回一個普通的T。一般狀況下,T內部有一些隱式的指針。一句話,new返回一個指向已清零內存的指針,而make返回一個複雜的結構。

總結

  • 多個slice指向相同的底層數組時,修改其中一個slice,可能會影響其餘slice的值;
  • slice做爲參數傳遞時,比數組更爲高效,由於slice的結構比較小;
  • slice在擴張時,可能會發生底層數組的變動及內存拷貝;
  • 由於slice引用了數組,這可能致使數組空間不會被gc,當數組空間很大,而slice引用內容不多時尤其嚴重;

Map

Go中的map在底層是用哈希表實現的。Golang採用了HashTable的實現,解決衝突採用的是鏈地址法。也就是說,使用數組+鏈表來實現map。

Map存儲的是無序的鍵值對集合。

不是全部的key都能做爲map的key類型,只有可以比較的類型才能做爲key類型。因此例如切片,函數,map類型是不能做爲map的key類型的。

map 查找操做⽐線性搜索快不少,但⽐起⽤序號訪問 array、slice,⼤約慢 100x 左右。

經過 map[key] 返回的只是⼀個 "臨時值拷⻉",修改其⾃⾝狀態沒有任何意義,只能從新 value 賦值或改⽤指針修改所引⽤的內存。

每一個bucket中存放最多8個key/value對, 若是多於8個,那麼會申請一個新的bucket,並將它與以前的bucket鏈起來。

注意一個細節是Bucket中key/value的放置順序,是將keys放在一塊兒,values放在一塊兒,爲何不將key和對應的value放在一塊兒呢?若是那麼作,存儲結構將變成key1/value1/key2/value2… 設想若是是這樣的一個map[int64]int8,考慮到字節對齊,會浪費不少存儲空間。不得不說經過上述的一個小細節,能夠看出Go在設計上的深思熟慮。

數據結構及內存管理

hashmap的定義位於 src/runtime/hashmap.go 中,首先咱們看下hashmap和bucket的定義:

type hmap struct {
  count     int    // 元素的個數
  flags     uint8  // 狀態標誌
  B         uint8  // 能夠最多容納 6.5 * 2 ^ B 個元素,6.5爲裝載因子
  noverflow uint16 // 溢出的個數
  hash0     uint32 // 哈希種子

  buckets    unsafe.Pointer // 桶的地址
  oldbuckets unsafe.Pointer // 舊桶的地址,用於擴容
  nevacuate  uintptr        // 搬遷進度,小於nevacuate的已經搬遷
  overflow *[2]*[]*bmap 
}
複製代碼

其中,overflow是一個指針,指向一個元素個數爲2的數組,數組的類型是一個指針,指向一個slice,slice的元素是桶(bmap)的地址,這些桶都是溢出桶;爲何有兩個?由於Go map在hash衝突過多時,會發生擴容操做,爲了避免全量搬遷數據,使用了增量搬遷,[0]表示當前使用的溢出桶集合,[1]是在發生擴容時,保存了舊的溢出桶集合;overflow存在的意義在於防止溢出桶被gc。

擴容

擴容會創建一個大小是原來2倍的新的表,將舊的bucket搬到新的表中以後,並不會將舊的bucket從oldbucket中刪除,而是加上一個已刪除的標記。

正是因爲這個工做是逐漸完成的,這樣就會致使一部分數據在old table中,一部分在new table中, 因此對於hash table的insert, remove, lookup操做的處理邏輯產生影響。只有當全部的bucket都從舊錶移到新表以後,纔會將oldbucket釋放掉。

Golang map 的底層實現

相關文章
相關標籤/搜索