無阻塞編程模型

時間 2019-11-21

標籤阻塞編程模型简体版

原文原文鏈接

無阻塞編程模型涉及到異步回調流， Task， async await，線程池，併發編程，並行編程，大併發架構，操做系統之上編程模型的發展等等。html

我這段時間對這個領域的現狀進行了一些收集整理和批判，請看：程序員

《後線程時代的應用程序架構》 http://www.javashuo.com/article/p-blioukym-ga.html數據庫

《我支持使用 async await》 http://www.javashuo.com/article/p-kfsmekfd-cv.html編程

單純從執行效率看，也許同步方法最直接，效率也最高。只要配合線程池合理使用線程就能夠。服務器

異步方法的意義在於實現無阻塞模式，閉包

而無阻塞模式的意義要在大併發且 IO 等待時間顯著、IO 可能長時間等待、 IO 等待時間不肯定（可能有意外）的時候纔會體現出來。架構

什麼是 IO 等待？ IO 等待本質上是 CPU 對外部設備的等待。併發

從應用上說， IO 等待就是訪問數據庫，調用 WebApi，讀寫文件， RPC 等。異步

假設線程池有 1000 個線程，能夠同時處理 1000 個用戶的請求，每一個請求都須要訪問數據庫，async

若是數據庫的查詢緩慢，則這 1000 個線程可能都會去等待數據庫，當有第 1001 個以上的用戶訪問網站時，線程池將沒有多餘的線程去處理第 1001 個以上的用戶的請求，這種狀況若是持續一段時間，就會變成服務器不能提供服務，若是數據庫處於「掛掉」的異常狀態，則 Web 服務器線程池裏的 1000 個線程都將長期等待數據庫而掛起，這樣服務器就不能提供服務，或者變得異常緩慢（對用戶而言）。

微服務的「雪崩」，大概也是從這裏來的。

且從廣義的角度來說，線程池的 1000 個線程原本還能夠有一部分去作其它工做（不須要訪問數據庫的工做，或是訪問其它數據庫的工做），但都卡在訪問 A 數據庫這裏了。

可是，咱們又不能採用無限制的建立線程（New Thread）的方式，過多的線程會花費比較多的切換時間，也會佔用比較大的內存空間，好比 1 個線程的堆棧是 1 MB，則 1024 個線程的堆棧空間總和就是 1024 * 1 MB = 1 GB 。

因此，須要對線程池裏的線程作一個角色分工來解決這個問題，這就是「m Work， n IO」，

「m Work， n IO」就是 m 個工做線程， n 個 IO 線程。

m 個工做線程在無阻塞的狀態下工做。

若是是單核 CPU，則能夠退化爲「1 Work， n IO」。

若是 1 個 CPU 核上只有 1 個工做線程，則稱爲「單體」（monosome， monad）。

Javascript 是單體。

咱們能夠來看看 3 種方式的 Sequence 圖：

1 調用同步方法，如 fileStream.Read() 方法，

2 調用 async 方法再 task.ContinueWith() ，

3 調用 async 方法，使用 await，

1 調用同步方法，如 fileStream.Read() 方法，

2 調用 async 方法再 task.ContinueWith() ，

3 調用 async 方法，使用 await，

「狀態機」就是將函數參數、局部變量等上下文保存在「狀態」中，將「狀態」保存在堆裏，以取代傳統的函數調用把參數、局部變量等上下文保存在棧裏的作法。

假設有個 Foo() 方法，

Foo()

{

…… // Part 1

await xxxAsync();

…… // Part 2

}

編譯器會將 Foo() 方法中 await 以前的代碼變成一個 Foo_Part1() 方法， Foo() 方法中 await 以後的代碼變成一個 Foo_Part2() 方法，

這樣 Foo() 方法就被「分割」成 3 個部分：

1 Foo_Part1()

2 await xxxAsync()

3 Foo_Part2()

在執行的時候，狀態機就能夠按「步驟」調用這 3 個部分，

先調用 Foo_Part1() ，再調用 xxxAsync()，以後轉入異步方法執行，本次調用結束。

當 xxxAsync() 執行完成後，會調用回調，回調調用狀態機，狀態機接着以前的「步驟」，繼續執行 Foo_Part2() 。

這整個過程連貫起來，就是 Foo_Part1() -> xxxAsync() -> Foo_Part2，這正還原了程序員寫的源代碼中的執行流程。

程序員寫的源代碼看起來是一個順序同步的執行過程，但其實是一個異步無阻塞的執行過程。

爲何要用狀態機？由於要實現異步架構，同時還要儘可能保持函數層層調用的邏輯層次結構。

好比，若是在執行中拋出異常，在異常信息中，能夠看到函數的調用層次，能夠看到異常是從「Foo_Part1()」中拋出來的，

這樣咱們就清楚異常出現在那一行代碼，

若是異常是從「Foo_Part2()」中拋出來的，那咱們也知道異常出如今 await xxxAsync(); 以後的代碼裏。

因此， async await 是一個語法糖，有網友說是編譯器的「黑魔法」，我總以爲 async await 這個語法糖有點大，能夠叫「語法蛋糕」。

而要實現真正的「n IO」無阻塞，還須要操做系統也用無阻塞的方式來實現 IO 。

假設有 n 個 IO 線程，操做系統應該用 1 個或 n 個線程去「輪流」等待多個設備的響應或者一個設備對多個請求的響應，

而不該該固定 1 個線程去等待 1 個請求的響應。

這種用線程「輪流」去等待設備響應的作法，就是 IOCP 。

理論上，只要 CPU 的處理速度足夠快， 1 個線程能夠等待（處理） n 個設備對 m 個請求的響應。

反之，若是固定 1 個線程「負責」等待 1 個請求的響應，則 n 個請求須要 n 個線程，

若是某設備的處理速度緩慢或者故障，而對該設備的請求是頻繁的，則 IO 線程都會去等待這個設備，這就堵塞了。

因而就沒有線程來處理其它設備的 IO 了。

這就回到了本文開篇提出的問題。

經過上面 3 個 Sequence 圖，咱們能夠看到：

相比同步方法，就單次調用而言，異步方法並不會減小線程切換的次數，異步方法的意義在於無阻塞。

可是從整體來看，無阻塞顯著的減小了線程的數量，更少的線程意味着更少的切換。

因此，從整體來看，異步方法也是減小了線程切換次數的。

無阻塞是有利的，是計算機軟件體系在後線程時代的一次發展進化。

無阻塞還能夠用於 SOA ，好比 SOA 中會有這樣的場景，一個業務須要調用若干個服務來完成。

這樣，就能夠這樣寫代碼：

Foo()

{

…… // 一些操做

Task t1 = Service1Async();

Task t2 = Service2Async();

Task t3 = Service3Async();

await Task.WhenAll( { t1, t2, t3} );

…… // 3 個服務都調用完成時要執行的操做

}

因爲服務完成的時間多是不肯定的，因此若是等服務 1 完成再調用服務 2，服務 2 完成再調用服務 3，這樣效率就比較低。

因此，經過無阻塞的方式，併發調用多個服務，而後等待服務所有完成，再作下一步操做，這樣能夠提升效率。

固然，這裏的「等待」，也是無阻塞的。 ^^

在無阻塞編程中，不能調用 Thread.Sleep() 來延時，這會阻塞線程，佔用線程，

而應該用 await Task.Delay() 方法來延時，或是用 Timer 來設定一個定時任務，把延時後要作的工做放到這個定時任務裏，

固然， await Task.Delay() 更加的直觀，但我猜 await Task.Delay() 內部也是用 Timer 原理實現的。

而用 Timer 定時任務來實現延時，這和 Javascript 的 window.setTimeout() 又是恰如其分的類似。

簡單的狀況， Task t; t.ContinueWith( 回調 ); 能夠很好的完成異步調用。 Lambda 式匿名函數、閉包以及 Task 的封裝已經使代碼很簡潔直觀。

可是對於一些場景，好比業務系統三層架構裏 DAL 層訪問數據庫，對數據進行一些處理後返回 BL 層， BL 層又把結果返回 UI 層，

咱們能夠調用 Async 方法訪問數據庫，以實現無阻塞，但這種須要對結果進行處理並層層返回的場景，用異步回調的話代碼就很麻煩，

而 async await 正是爲了解決「過多的異步回調把代碼切割的支離破碎」的問題，因此 async await 是良性的。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

無阻塞 編程模型

無阻塞編程模型