.net 系列：併發編程之一【併發編程的初步理論】

時間 2020-07-06

標籤系列併發編程之一併發編程的初步理論简体版

原文原文鏈接

1、關於併發編程的幾個誤解算法

1）併發就是多線程編程

實際上多線程只是併發編程的一種形式而已，在C#中還有不少其餘的併發編程技術，包括異步編程，並行編程，TPL數據流，響應式編程等。服務器

2）只有大型服務器才須要考慮併發多線程

服務器端的大型程序要響應大量客戶端的數據請求，固然要充分考慮併發。可是桌面程序和手機、平板等移動端應用一樣須要考慮併發編程，由於它們是直接面向最終用戶的，而如今用戶對使用體驗的要求愈來愈高。程序必須能隨時響應用戶的操做，尤爲是在後臺處理時（讀寫數據、與服務器通訊等），這正是併發編程的目的之一。併發

3）併發編程很複雜，必須掌握不少底層技術 異步

C# 和.NET 提供了不少程序庫，併發編程已經變得簡單多了。尤爲是.NET 4.5 推出了全新的async 和await 關鍵字，使併發編程的代碼減小到了最低限度。並行處理和異步開發已經再也不是高手們的專利，每一個開發人員都能寫出交互性良好、高效、可靠的併發程序。async

2、併發的幾個名稱術語異步編程

併發：同事作多件事情
多線程：併發的一種形式，它採用多個線程來執行處理。
並行處理（並行編程）：把正在執行的大量任務分割成幾個小塊，分配給多個同時運行的線程，是多線程的一種表現形式。
異步編程：併發的一種形式，它採用future 模塊或回調（callback）機制，以免產生堵塞。
響應式編程：一種聲明式的編程模式，程序在該模式下對事件作出響應。

3、異步編程簡介 函數

異步編程有兩大好處。第一個好處是對於面向終端用戶的GUI 程序：異步編程提升了響應能力。咱們都遇到過在運行時會臨時鎖定界面的程序，異步編程可使程序在執行任務時仍能響應用戶的輸入。第二個好處是對於服務器端應用：異步編程實現了可擴展性。服務器應用能夠利用線程池知足其可擴展性，使用異步編程後，可擴展性一般能夠提升一個數量級。現代的異步.NET 程序使用兩個關鍵字：async 和await。async 關鍵字加在方法聲明上，它的主要目的是使方法內的await 關鍵字生效（爲了保持向後兼容，同時引入了這兩個關鍵字）。若是async 方法有返回值，應返回Task<T>；若是沒有返回值，應返回Task。這些task 類型至關於future，用來在異步方法結束時通知主程序。性能

我舉個例子：

 1 async Task DoSomethingAsync()
 2 {
 3    int val = 13;
 4   // 異步方式等待1 秒
 5    await Task.Delay(TimeSpan.FromSeconds(1));
 6    val *= 2;
 7  8    // 異步方式等待1 秒
 9    await Task.Delay(TimeSpan.FromSeconds(1));
10    Trace.WriteLine(val);
11 }

async 方法在開始時以同步方式執行。在async 方法內部，await 關鍵字對它的參數執行一個異步等待。它首先檢查操做是否已經完成，若是完成了，就繼續運行（同步方式）。不然，它會暫停async 方法，並返回，留下一個未完成的task。一段時間後，操做完成，async 方法就恢復運行。

一個async 方法是由多個同步執行的程序塊組成的，每一個同步程序塊之間由await 語句分隔。第一個同步程序塊在調用這個方法的線程中運行，但其餘同步程序塊在哪裏運行呢？狀況比較複雜。最多見的狀況是，用await 語句等待一個任務完成，當該方法在await 處暫停時，就能夠捕捉上下文（context）。若是當前SynchronizationContext 不爲空，這個上下文就是當前SynchronizationContext。若是當前SynchronizationContext 爲空，則這個上下文爲當前TaskScheduler。該方法會在這個上下文中繼續運行。通常來講，運行UI 線程時採用UI 上下文，處理ASP.NET 請求時採用ASP.NET 請求上下文，其餘不少狀況下則採用線程池上下文。

有兩種基本的方法能夠建立Task 實例。有些任務表示CPU 須要實際執行的指令，建立這種計算類的任務時，使用Task.Run（如須要按照特定的計劃運行，則用TaskFactory.StartNew）。其餘的任務表示一個通知（notification），建立這種基於事件的任務時，使用TaskCompletionSource<T>。大部分I/O 型任務採用TaskCompletionSource<T>。

使用async 和await 時，天然要處理錯誤。在下面的代碼中，PossibleExceptionAsync 會拋出一個NotSupportedException 異常，而TrySomethingAsync 方法可很順利地捕捉到這個異常。這個捕捉到的異常完整地保留了棧軌跡，沒有人爲地將它封裝進TargetInvocationException 或AggregateException 類：

 1 async Task TrySomethingAsync()
 2 {
 3   try
 4  {
 5     await PossibleExceptionAsync();
 6  }
 7  catch(NotSupportedException ex)
 8  {
 9    LogException(ex);
10    throw;
11  }
12 }

一旦異步方法拋出（或傳遞出）異常，該異常會放在返回的Task 對象中，而且這個Task對象的狀態變爲「已完成」。當await 調用該Task 對象時，await 會得到並（從新）拋出該異常，而且保留着原始的棧軌跡。所以，若是PossibleExceptionAsync 是異步方法，如下代碼就能正常運行：

 1 async Task TrySomethingAsync()
 2 {
 3 // 發生異常時，任務結束。不會直接拋出異常。
 4    Task task = PossibleExceptionAsync();
 5    try
 6    {
 7         //Task 對象中的異常，會在這條await 語句中引起
 8  9         await task;
10    }
11    catch(NotSupportedException ex)
12    {
13        LogException(ex);
14        throw;
15    }
16 }

關於異步方法，還有一條重要的準則：你一旦在代碼中使用了異步，最好一直使用。調用異步方法時，應該（在調用結束時）用await 等待它返回的task 對象。必定要避免使用Task.Wait 或Task<T>.Result 方法，由於它們會致使死鎖。參考一下下面這個方法：

 1 async Task WaitAsync()
 2 {
 3     // 這裏awati 會捕獲當前上下文……
 4      await Task.Delay(TimeSpan.FromSeconds(1));
 5     // ……這裏會試圖用上面捕獲的上下文繼續執行
 6 }
 7 void Deadlock()
 8 {
 9    // 開始延遲
10    Task task = WaitAsync();
11    // 同步程序塊，正在等待異步方法完成
12    task.Wait();
13 }

若是從UI 或ASP.NET 的上下文調用這段代碼，就會發生死鎖。這是由於，這兩種上下文每次只能運行一個線程。Deadlock 方法調用WaitAsync 方法，WaitAsync 方法開始調用delay 語句。而後，Deadlock 方法（同步）等待WaitAsync 方法完成，同時阻塞了上下文線程。當delay 語句結束時，await 試圖在已捕獲的上下文中繼續運行WaitAsync 方法，但這個步驟沒法成功，由於上下文中已經有了一個阻塞的線程，而且這種上下文只容許同時運行一個線程。這裏有兩個方法能夠避免死鎖：在WaitAsync 中使用ConfigureAwait(false)（致使await 忽略該方法的上下文），或者用await 語句調用WaitAsync 方法（讓Deadlock變成一個異步方法）。

4、並行編程簡介

若是程序中有大量的計算任務，而且這些任務能分割成幾個互相獨立的任務塊，那就應該使用並行編程。並行編程可臨時提升CPU 利用率，以提升吞吐量，若客戶端系統中的CPU 常常處於空閒狀態，這個方法就很是有用，但一般並不適合服務器系統。大多數服務器自己具備並行處理能力，例如ASP.NET 可並行地處理多個請求。某些狀況下，在服務器系統中編寫並行代碼仍然有用（若是你知道併發用戶數量會一直是少數）。但一般狀況下，在服務器系統上進行並行編程，將下降自己的並行處理能力，而且不會有實際的好處。並行的形式有兩種：數據並行（data parallelism）和任務並行（task parallelim）。數據並行是指有大量的數據須要處理，而且每一塊數據的處理過程基本上是彼此獨立的。任務並行是指須要執行大量任務，而且每一個任務的執行過程基本上是彼此獨立的。任務並行能夠是動態的，若是一個任務的執行結果會產生額外的任務，這些新增的任務也能夠加入任務池。

實現數據並行有幾種不一樣的作法。一種作法是使用Parallel.ForEach 方法，它相似於foreach 循環，應儘量使用這種作法。

Parallel 類提供Parallel.For 和ForEach方法，這相似於for 循環，當數據處理過程基於一個索引時，可以使用這個方法。下面是使用Parallel.ForEach 的代碼例子：

1 void RotateMatrices(IEnumerable<Matrix> matrices, float degrees)
2 {
3     Parallel.ForEach(matrices, matrix => matrix.Rotate(degrees));
4 }

另外一種作法是使用PLINQ（Parallel LINQ）, 它爲LINQ 查詢提供了AsParallel 擴展。跟PLINQ 相比，Parallel 對資源更加友好，Parallel 與系統中的其餘進程配合得比較好, 而PLINQ 會試圖讓全部的CPU 來執行本進程。Parallel 的缺點是它太明顯。不少狀況下，PLINQ 的代碼更加優美。

1 IEnumerable<bool> PrimalityTest(IEnumerable<int> values)
2 {
3     return values.AsParallel().Select(val => IsPrime(val));
4 }

無論選用哪一種方法，在並行處理時有一個很是重要的準則只要任務塊是互相獨立的，並行性就能作到最大化。一旦你在多個線程中共享狀態，就必須以同步方式訪問這些狀態，那樣程序的並行性就變差了。

有多種方式能夠控制並行處理的輸出，能夠把結果存在某些併發集合，或者對結果進行聚合。聚合在並行處理中很常見，Parallel 類的重載方法，也支持這種map/reduce 函數。

下面講任務並行。數據並行重點在處理數據，任務並行則關注執行任務。Parallel 類的Parallel.Invoke 方法能夠執行「分叉/ 聯合」（fork/join）方式的任務並行。調用該方法時，把要並行執行的委託（delegate）做爲傳入參數：

 1 void ProcessArray(double[] array)
 2 {
 3     Parallel.Invoke(
 4     () => ProcessPartialArray(array, 0, array.Length / 2),
 5     () => ProcessPartialArray(array, array.Length / 2, array.Length)
 6     );
 7 }
 8 void ProcessPartialArray(double[] array, int begin, int end)
 9 {
10    // CPU 密集型的操做……
11 }

數據並行和任務並行都使用動態調整的分割器，把任務分割後分配給工做線程。線程池在須要的時候會增長線程數量。線程池線程使用工做竊取隊列（work-stealing queue）。微軟公司爲了讓每一個部分儘量高效，作了不少優化。要讓程序獲得最佳的性能，有不少參數能夠調節。只要任務時長不是特別短，採用默認設置就會運行得很好。

若是任務過短，把數據分割進任務和在線程池中調度任務的開銷會很大。若是任務太長，線程池就不能進行有效的動態調整以達到工做量的平衡。很難肯定「過短」和「太長」的判斷標準，這取決於程序所解決問題的類型以及硬件的性能。根據一個通用的準則，只要沒有致使性能問題，我會讓任務儘量短（若是任務過短，程序性能會忽然下降）。更好的作法是使用Parallel 類型或者PLINQ，而不是直接使用任務。這些並行處理的高級形式，自帶有自動分配任務的算法（而且會在運行時自動調整）。

5、多線程編程簡介

線程是一個獨立的運行單元，每一個進程內部有多個線程，每一個線程能夠各自同時執行指令。每一個線程有本身獨立的棧，可是與進程內的其餘線程共享內存。對某些程序來講，其中有一個線程是特殊的，例如用戶界面程序有一個UI 線程，控制檯程序有一個main 線程。

每一個.NET 程序都有一個線程池，線程池維護着必定數量的工做線程，這些線程等待着執行分配下來的任務。線程池能夠隨時監測線程的數量。配置線程池的參數多達幾十個，可是建議採用默認設置，線程池的默認設置是通過仔細調整的，適用於絕大多數現實中的應用場景。