由淺入深聊聊Golang的sync.Pool

時間 2019-11-17

標籤由淺入深聊聊 golang sync.pool sync pool 欄目 Go 简体版

原文原文鏈接

前言

今天在思考優化GC的套路，看到了sync.Pool，那就來總結下，但願能夠有個了斷。html

用最通俗的話，講明白知識。如下知識點10s後即將到來。golang

1.pool是什麼？ 2.爲何須要sync.Pool？ 3.如何使用sync.Pool？ 4.走一波源碼 5.源碼關鍵點解析數據庫

正文

1.sync.Pool是什麼？

Golang在 1.3 版本的時候，在sync包中加入一個新特性：Pool。簡單的說：就是一個臨時對象池。數組

2.爲何須要sync.Pool？

保存和複用臨時對象，減小內存分配，下降GC壓力。緩存

（對象越多GC越慢，由於Golang進行三色標記回收的時候，要標記的也越多，天然就慢了） bash

3.如何使用sync.Pool？

func main() {
	// 初始化一個pool
	pool := &sync.Pool{
		// 默認的返回值設置，不寫這個參數，默認是nil
		New: func() interface{} {
			return 0
		},
	}

	// 看一下初始的值，這裏是返回0，若是不設置New函數，默認返回nil
	init := pool.Get()
	fmt.Println(init)

	// 設置一個參數1
	pool.Put(1)

	// 獲取查看結果
	num := pool.Get()
	fmt.Println(num)

	// 再次獲取，會發現，已是空的了，只能返回默認的值。
	num = pool.Get()
	fmt.Println(num)
}

複製代碼

使用較爲簡單。總的思路就是：搞一個池子，預先放入臨時產生的對象，而後取出使用。數據結構

可能有同窗問了，這個玩意兒官方出的，那他本身有在用嗎？答案是有的，其實你也一直在用。併發

就是fmt包啦，因爲fmt老是須要不少[]byte對象，索性就直接建了一個[]byte對象的池子，來走一波代碼。app

type buffer []byte
// printer狀態的結構體（）
type pp struct {
    ...
}

// pp的對象池， 《====這裏用到了。
var ppFree = sync.Pool{
    New: func() interface{} { return new(pp) },
}

// 每次須要pp結構體的時候，都過sync.Pool進行獲取。
func newPrinter() *pp {
    p := ppFree.Get().(*pp)
    p.panicking = false
    p.erroring = false
    p.fmt.init(&p.buf)
    return p
}
複製代碼

4.走一波源碼

4.1 基礎數據結構

type Pool struct {
	// noCopy，防止當前類型被copy，是一個有意思的字段，後文詳說。
	noCopy noCopy

    // [P]poolLocal 數組指針
	local     unsafe.Pointer
	// 數組大小
	localSize uintptr        

	// 選填的自定義函數，緩衝池無數據的時候會調用，不設置默認返回nil
	New func() interface{} //新建對象函數
}

type poolLocalInternal struct {
    // 私有緩存區
	private interface{}   
	// 公共緩存區
	shared  []interface{} 
	// 鎖
	Mutex               
}

type poolLocal struct {
	// 每一個P對應的pool
	poolLocalInternal

	// 這個字段頗有意思，是爲了防止「false sharing/僞共享」，後文詳講。
	pad [128 - unsafe.Sizeof(poolLocalInternal{})%128]byte
}
複製代碼

來一張全景圖，更有利於全局角度看這個結構體： dom

這邊有兩個小問題：

noCopy的做用？
poolLocal中pad的做用？
如何肯定要獲取的數據在哪一個poolLocal裏頭？

帶着問題，繼續往下看，看完就能懂這兩個小問題拉。

4.2 pin

在介紹get/put前，關鍵的基礎函數pin須要先了解一下。一句話說明用處：肯定當前P綁定的localPool對象 （這裏的P，是MPG中的P，若是看不懂請點這裏：關於goroutine的一些小理解）

func (p *Pool) pin() *poolLocal {
	// 返回當前 P.id && 設置禁止搶佔（避免GC）
	pid := runtime_procPin()
	
	// 根據locaSize來獲取當前指針偏移的位置
	s := atomic.LoadUintptr(&p.localSize) 
	l := p.local         
	
	// 有可能在運行中動調調整P，因此這裏進行須要判斷是否越界
	if uintptr(pid) < s {
	    // 沒越界，直接返回
		return indexLocal(l, pid)
	}
	
    // 越界時，會涉及全局加鎖，從新分配poolLocal，添加到全局列表
	return p.pinSlow()
}

var (
	allPoolsMu Mutex
	allPools   []*Pool
)


func (p *Pool) pinSlow() *poolLocal {
	// 取消P的禁止搶佔（由於後面要進行metux加鎖）
	runtime_procUnpin()
	
	// 加鎖
	allPoolsMu.Lock()
	defer allPoolsMu.Unlock()
	
	// 返回當前 P.id && 設置禁止搶佔（避免GC）
	pid := runtime_procPin()
	
	// 再次檢查是否符合條件，有可能中途已被其餘線程調用
	s := p.localSize
	l := p.local
	if uintptr(pid) < s {
		return indexLocal(l, pid)
	}
	
	// 若是數組爲空，則新建Pool，將其添加到 allPools，GC以此獲取全部 Pool 實例
	if p.local == nil {
		allPools = append(allPools, p)
	}
	
    // 根據 P 數量建立 slice
	size := runtime.GOMAXPROCS(0)
	local := make([]poolLocal, size)
	
	 // 將底層數組起始指針保存到 Pool.local，並設置 P.localSize
	 // 這裏須要關注的是：若是GOMAXPROCS在GC間發生變化，則會從新分配的時候，直接丟棄老的，等待GC回收。
	atomic.StorePointer(&p.local, unsafe.Pointer(&local[0]))
	atomic.StoreUintptr(&p.localSize, uintptr(size))         
	
	// 返回本次所需的 poolLocal
	return &local[pid]
}

// 根據數據結構的大小來計算指針的偏移量
func indexLocal(l unsafe.Pointer, i int) *poolLocal {
	lp := unsafe.Pointer(uintptr(l) + uintptr(i)*unsafe.Sizeof(poolLocal{}))
	return (*poolLocal)(lp)
}
複製代碼

流程小記：

禁止搶佔GC -> 尋找偏移量 -> 檢查越界 ->返回poolLocal
                                   ->加鎖重建pool，並添加到allPool
複製代碼

4.3 put

先說結論：優先放入private空間，後面再放入shared空間 如今開始分析：

func (p *Pool) Put(x interface{}) {
	if x == nil {
		return
	}
    
    // 這段代碼，不須要關心，下降競爭的
	if race.Enabled {
		if fastrand()%4 == 0 {
			// Randomly drop x on floor.
			return
		}
		race.ReleaseMerge(poolRaceAddr(x))
		race.Disable()
	}

    // 獲取當前的poolLocal
	l := p.pin()

    // 若是private爲nil，則優先進行設置，並標記x
	if l.private == nil {
		l.private = x
		x = nil
	}
	runtime_procUnpin()

    // 若是標記x不爲nil，則將x設置到shared中
	if x != nil {
		l.Lock()
		l.shared = append(l.shared, x)
		l.Unlock()
	}
    
    // 設置競爭可用了。
	if race.Enabled {
		race.Enable()
	}
}
複製代碼

4.4 get

先說結論：優先從private空間拿，再加鎖從shared空間拿，尚未再從其餘的PoolLocal的shared空間拿，尚未就直接new一個返回。 如今進行分析：

func (p *Pool) Get() interface{} {
    // 競爭相關的設置
	if race.Enabled {
		race.Disable()
	}
    
    // 獲取當前的poolLocal
	l := p.pin()

    // 從private中獲取
	x := l.private
	l.private = nil
	runtime_procUnpin()

    // 不存在，則繼續從shared空間拿，
	if x == nil {
	    // 加鎖了，防止併發 
		l.Lock()
		last := len(l.shared) - 1
		if last >= 0 {
			x = l.shared[last]
            // 從尾巴開始拿起
			l.shared = l.shared[:last]
		}
		l.Unlock()
		if x == nil {
		    // 從其餘的poolLocal中的shared空間看看有沒有可返回的。
			x = p.getSlow()
		}
	}
    
    // 競爭解除
	if race.Enabled {
		race.Enable()
		if x != nil {
			race.Acquire(poolRaceAddr(x))
		}
	}
    
    // 若是仍是沒有的話，就直接new一個了
	if x == nil && p.New != nil {
		x = p.New()
	}
	return x
}

func (p *Pool) getSlow() (x interface{}) {
    // 獲取poolLocal數組的大小
	size := atomic.LoadUintptr(&p.localSize) // load-acquire
	local := p.local                         // load-consume
	
	// 嘗試從其餘procs獲取一個P對象
	pid := runtime_procPin()
	runtime_procUnpin()
	
	for i := 0; i < int(size); i++ {
        // 獲取一個poolLocal，注意這裏是從當前的local的位置開始獲取的，目的是防止取到自身
		l := indexLocal(local, (pid+i+1)%int(size))
		// 加鎖從尾部獲取shared的數據
		l.Lock()
		last := len(l.shared) - 1
        // 若長度大於1
		if last >= 0 {
			x = l.shared[last]
			l.shared = l.shared[:last]
			l.Unlock()
			break
		}
		l.Unlock()
	}
	return x
}

複製代碼

5.源碼關鍵點解析

5.1 定時清理

Q：這裏的pool的是永久保存的嗎？仍是？ A：是會進行清理的，時間就是兩次GC間隔的時間。

// 註冊清理函數，隨着runtime進行的，也就是每次GC都會跑一下
func init() {
	runtime_registerPoolCleanup(poolCleanup)
}

// 清理函數也很粗暴，直接遍歷全局維護的allPools將private和shared置爲nil
func poolCleanup() {
    // 遍歷allPools
	for i, p := range allPools {
	    // pool置爲nil
		allPools[i] = nil
  
        // 遍歷localSIze的數量次
		for i := 0; i < int(p.localSize); i++ {
			l := indexLocal(p.local, i)
            // private置爲nil
			l.private = nil
            
            // 遍歷shared，都置爲nil
			for j := range l.shared {
				l.shared[j] = nil
			}
			l.shared = nil
		}
		p.local = nil
		p.localSize = 0
	}
 
    // allPools重置
	allPools = []*Pool{}
}
複製代碼

因此呢，這也說明爲何sync.Pool不適合放作「數據庫鏈接池」等帶持久性質的數據，由於它會按期回收啊～

5.2 爲何獲取shared要加鎖，而private不用？

咱們知道golang是MPG的方式運行的，（關於goroutine的一些小理解）

大概這麼個感受吧：

M------P----- poolLocal    
       |        
       G - G
           |
           G
          ...
M------P----- poolLocal  
       |
       G---G
           |
           G
          ...
複製代碼

也就是說，每一個P都分配一個localPool，在同一個P下面只會有一個Gouroutine在跑，因此這裏的private，在同一時間就只可能被一個Gouroutine獲取到。

而shared就不同了，有可能被其餘的P給獲取走，在同一時間就只可能被多個Gouroutine獲取到，爲了保證數據競爭，必須加一個鎖來保證只會被一個G拿走。

5.3 noCopy的做用？

防止Pool被拷貝，由於Pool 在Golang是全劇惟一的

這裏又衍生一個問題，這裏的noCopy如何實現被防止拷貝的？？？

Golang中沒有原生的禁止拷貝的方式，因此結構體不但願被拷貝，因此go做者作了這麼一個約定：只要包含實現 sync.Locker 這個接口的結構體noCopy，go vet 就能夠幫咱們進行檢查是否被拷貝了。

5.4 pad的做用？

這個挺有意思的，源代碼出現這麼一個詞：false sharing，翻譯爲「僞共享」。也就是說這個字段，主要就是用來防止「僞共享」的。

爲何會有false sharing？

簡單說明一下：緩存系統中是以緩存行爲單位存儲的。緩存行一般是 64 字節，當緩存行加載其中1個字節時候，其餘的63個也會被加載出來，加鎖的話也會加鎖整個緩存行，當下圖所示x、y變量都在一個緩存行的時候，當進行X加鎖的時候，正好另外一個獨立線程要操做Y，這會兒Y就要等X了，此時就不沒法併發了。

因爲這裏的競爭衝突來源自共享，因此稱之爲僞共享。