Golang 併發編程

時間 2020-08-04

標籤 golang 併發編程欄目 Go 简体版

原文原文鏈接

前言

簡而言之，所謂併發編程是指在一臺處理器上「同時」處理多個任務。linux

隨着硬件的發展，併發程序變得愈來愈重要。Web服務器會一次處理成千上萬的請求。平板電腦和手機app在渲染用戶畫面同時還會後臺執行各類計算任務和網絡請求。即便是傳統的批處理問題--讀取數據，計算，寫輸出--如今也會用併發來隱藏掉I/O的操做延遲以充分利用現代計算機設備的多個核心。計算機的性能每一年都在以非線性的速度增加。git

宏觀的併發是指在一段時間內，有多個程序在同時運行。編程

併發在微觀上，是指在同一時刻只能有一條指令執行，但多個程序指令被快速的輪換執行，使得在宏觀上具備多個進程同時執行的效果，但在微觀上並非同時執行的，只是把時間分紅若干段，使多個程序快速交替的執行。windows

並行和併發

並行： 並行(parallel)：指在同一時刻，有多條指令在多個 CPU 處理器上同時執行。安全

併發(concurrency)： 指在同一時刻只能有一條指令執行，但多個進程指令被快速的輪換執行。使得在宏觀上具備多個進程同時執行的效果，但在微觀上並非同時執行的，只是把時間分紅若干段，經過 cpu 時間片輪轉使多個進程快速交替的執行。bash

宏觀：用戶體驗上，程序在並行執行。
微觀：多個計劃任務，順序執行，在飛快的切換，輪換使用 cpu 時間輪片。

大師曾以咖啡機的例子來解釋並行和併發的區別：服務器

並行是兩個隊列同時使用兩臺咖啡機（真正的多任務）
併發是兩個隊列交替使用一臺咖啡機（假的多任務）

常見併發編程技術

進程併發

程序和進程

程序，是指編譯好的二進制文件，只佔用磁盤空間，不佔用系統資源(cpu、內存、打開的文件、設備、鎖 ...)網絡

進程，是一個抽象的概念，與操做系統原理聯繫緊密。進程是活躍的程序，佔用系統資源。在內存中執行。(程序運行起來，產生一個進程)數據結構

程序 → 劇本(紙) 進程 → 戲(舞臺、演員、燈光、道具 ...)多線程

同一個劇本能夠在多個舞臺同時上演。一樣，同一個程序也能夠加載爲不一樣的進程(彼此之間互不影響)

如：同時開兩個終端。各自都有一個 bash 但彼此 ID 不一樣。

在 windows 系統下，經過查看「任務管理器」，能夠查看相應的進程。運行起來的程序就是一個進程。以下圖所示：

進程狀態

進程基本的狀態有5種。分別爲初始態，就緒態，運行態，掛起（阻塞）態與終止（中止）態。其中初始態爲進程準備階段，常與就緒態結合來看。

進程併發

在使用進程實現併發時會出現什麼問題呢？

系統開銷比較大，佔用資源比較多，開啓進程數量比較少。
在 unix/linux 系統下，還會產生孤兒進程和殭屍進程。

經過前面查看操做系統的進程信息，咱們知道在操做系統中，能夠產生不少的進程。

在 unix/linux 系統中，正常狀況下，子進程是經過父進程 fork 建立的，子進程再建立新的進程。

而且父進程永遠沒法預測子進程到底何時結束。當一個進程完成它的工做終止以後，它的父進程須要調用系統調用取得子進程的終止狀態。

孤兒進程：父進程先於子進程結束，則子進程成爲孤兒進程，子進程的父進程成爲 init 進程，稱爲 init 進程領養孤兒進程。

殭屍進程：子進程終止，父進程還沒有回收，子進程殘留資源（PCB）存放於內核中，變成殭屍（Zombie）進程。

Windows 下的進程和 Linux 下的進程是不同的，它比較懶惰，歷來不執行任何東西，只是爲線程提供執行環境。而後由線程負責執行包含在進程的地址空間中的代碼。當建立一個進程的時候，操做系統會自動建立這個進程的第一個線程，成爲主線程。

線程併發

什麼是線程

LWP：light weight process 輕量級的進程，本質還是進程 (Linux下)

進程：獨立地址空間，擁有 PCB

線程：有獨立的 PCB，但沒有獨立的地址空間(共享)

區別：在因而否共享地址空間。獨居(進程)；合租(線程)。

進程：最小分配資源單位，可當作是隻有一個線程的進程。

線程：最小的執行單位

Windows 系統下，能夠直接忽略進程的概念，只談線程。由於線程是最小的執行單位，是被系統獨立調度和分派的基本單位。而進程只是給線程提供執行環境。

線程同步

同步即協同步調，按預約的前後次序運行。

線程同步，指一個線程發出某一功能調用時，在沒有獲得結果以前，該調用不返回。同時其它線程爲保證數據一致性，不能調用該功能。

舉例1：銀行存款 5000。櫃檯：取3000；同時提款機：取 3000。剩餘：2000。

舉例2：內存中 100 字節，線程T1欲填入全1，線程T2欲填入全0。但若是T1執行了50個字節失去cpu，T2執行，會將T1寫過的內容覆蓋。當T1再次得到cpu繼續從失去cpu的位置向後寫入1，當執行結束，內存中的100字節，既不是全1，也不是全0。

產生的現象叫作「與時間有關的錯誤」(time related)。爲了不這種數據混亂，線程須要同步。

「同步」的目的，是爲了不數據混亂，解決與時間有關的錯誤。實際上，不只線程間須要同步，進程間、信號間等等都須要同步機制。

所以，全部「多個控制流，共同操做一個共享資源」的狀況，都須要同步。

鎖的應用

互斥量 mutex

Linux 中提供一把互斥鎖 mutex（也稱之爲互斥量）。

每一個線程在對資源操做前都嘗試先加鎖，成功加鎖才能操做，操做結束解鎖。

資源仍是共享的，線程間也仍是競爭的，但經過「鎖」就將資源的訪問變成互斥操做，然後與時間有關的錯誤也不會再產生了。

可是應注意：同一時刻，只能有一個線程持有該鎖。

當 A 線程對某個全局變量加鎖訪問，B 在訪問前嘗試加鎖，拿不到鎖，B 阻塞。C 線程不去加鎖，而直接訪問該全局變量，依然可以訪問，但會出現數據混亂。

因此，互斥鎖實質上是操做系統提供的一把「建議鎖」（又稱「協同鎖」），建議程序中有多線程訪問共享資源的時候使用該機制。可是並無強制限定。

所以，即便有了 mutex，若是有線程不按規則來訪問數據，依然會形成數據混亂。

讀寫鎖

與互斥量相似，但讀寫鎖容許更高的並行性。其特性爲：寫獨佔，讀共享。

讀寫鎖狀態：

特別強調：讀寫鎖只有一把，但其具有兩種狀態：

讀模式下加鎖狀態 (讀鎖)
寫模式下加鎖狀態 (寫鎖)

讀寫鎖特性：

讀寫鎖是「寫模式加鎖」時，解鎖前，全部對該鎖加鎖的線程都會被阻塞。
讀寫鎖是「讀模式加鎖」時，若是線程以讀模式對其加鎖會成功；若是線程以寫模式加鎖會阻塞。
讀寫鎖是「讀模式加鎖」時，既有試圖以寫模式加鎖的線程，也有試圖以讀模式加鎖的線程。那麼讀寫鎖會阻塞隨後的讀模式鎖請求。優先知足寫模式鎖。讀鎖、寫鎖並行阻塞，寫鎖優先級高

讀寫鎖也叫共享-獨佔鎖。當讀寫鎖以讀模式鎖住時，它是以共享模式鎖住的；當它以寫模式鎖住時，它是以獨佔模式鎖住的。寫獨佔、讀共享。

讀寫鎖很是適合於對數據結構讀的次數遠大於寫的狀況。