當在讀這篇文章的時候,你想過沒有,服務器是怎麼把這篇文章發送給你的呢?程序員
說簡單也簡單,不就是一個用戶請求嗎?服務器根據請求從數據庫中撈出這篇文章,而後經過網絡發回去。web
說複雜也複雜,服務器是如何並行處理成千上萬個用戶請求呢?這裏面涉及到哪些技術呢?數據庫
這篇文章就來爲你解答這個問題。編程
歷史上最先出現也是最簡單的一種併到處理多個請求的方法就是利用多進程。服務器
好比在Linux世界中,咱們可使用fork、exec等方法建立多個進程,咱們能夠在父進程中接收用戶的連接請求,而後建立子進程去處理用戶請求,就像這樣:網絡
這種方法的優勢就在於:多線程
多進程並行處理的優勢和明顯,可是缺點一樣明顯:併發
幸虧,除了進程,咱們還有線程。app
不是建立進程開銷大嗎?不是進程間通訊困難嗎?這些對於線程來講通通不是問題。異步
什麼?你還不瞭解線程,趕忙看看這篇《看完這篇還不懂高併發中的線程與線程池你來打我(內含20張圖)》,這裏詳細講解了線程這個概念是怎麼來的。
因爲線程共享進程地址空間,所以線程間通訊自然不須要藉助任何通訊機制,直接讀取內存就行了。
線程建立銷燬的開銷也變小了,要知道線程就像寄居蟹同樣,房子(地址空間)都是進程的,本身只是一個租客,所以很是的輕量級,建立銷燬的開銷也很是小。
咱們能夠爲每一個請求建立一個線程,即便一個線程因執行I/O操做——好比讀取數據庫等——被阻塞暫停運行也不會影響到其它線程,就像這樣:
但線程就是完美的、包治百病的嗎,顯然,計算機世界歷來沒有那麼簡單。
因爲線程共享進程地址空間,這在爲線程間通訊帶來便利的同時也帶來了無盡的麻煩。
正是因爲線程間共享地址空間,所以一個線程崩潰會致使整個進程崩潰退出,同時線程間通訊簡直太簡單了,簡單到線程間通訊只須要直接讀取內存就能夠了,也簡單到出現問題也極其容易,死鎖、線程間的同步互斥、等等,這些極容易產生bug,無數程序員寶貴的時間就有至關一部分用來解決多線程帶來的無盡問題。
雖然線程也有缺點,可是相比多進程來講,線程更有優點,但想單純的利用多線程就能解決高併發問題也是不切實際的。
由於雖然線程建立開銷相比進程小,但依然也是有開銷的,對於動輒數萬數十萬的連接的高併發服務器來講,建立數萬個線程會有性能問題,這包括內存佔用、線程間切換,也就是調度的開銷。
所以,咱們須要進一步思考。
到目前爲止,咱們提到「並行」二字就會想到進程、線程。可是,並行編程只能依賴這兩項技術嗎,並非這樣的。
還有另外一項並行技術普遍應用在GUI編程以及服務器編程中,這就是近幾年很是流行的事件驅動編程,event-based concurrency。
你們不要以爲這是一項很難懂的技術,實際上事件驅動編程原理上很是簡單。
這一技術須要兩種原料:
剩下的就簡單了:
你只須要安靜的等待event到來就好,當event到來以後,檢查一下event的類型,並根據該類型找到對應的event處理函數,也就是event handler,而後直接調用該event handler就行了。
That's it !
以上就是事件驅動編程的所有內容,是否是很簡單!
從上面的討論能夠看到,咱們須要不斷的接收event而後處理event,所以咱們須要一個循環(用while或者for循環均可以),這個循環被稱爲Event loop。
使用僞代碼表示就是這樣:
while(true) {
event = getEvent();
handler(event);
}
Event loop中要作的事情實際上是很是簡單的,只須要等待event的帶來,而後調用相應的event處理函數便可。
注意,這段代碼只須要運行在一個線程或者進程中,只須要這一個event loop就能夠同時處理多個用戶請求。
有的同窗能夠依然不明白爲何這樣一個event loop能夠同時處理多個請求呢?
緣由很簡單,對於web服務器來講,處理一個用戶請求時大部分時間其實都用在了I/O操做上,像數據庫讀寫、文件讀寫、網絡讀寫等。當一個請求到來,簡單處理以後可能就須要查詢數據庫等I/O操做,咱們知道I/O是很是慢的,當發起I/O後咱們大能夠不用等待該I/O操做完成就能夠繼續處理接下來的用戶請求。
如今你應該明白了吧,雖然上一個用戶請求尚未處理完咱們其實就能夠處理下一個用戶請求了,這就是並行,這種並行就能夠用事件驅動編程來處理。
這就比如餐廳服務員同樣,一個服務員不可能一直等這上一個顧客下單、上菜、吃飯、買單以後才接待下一個顧客,服務員是怎麼作的呢?當一個顧客下完單後直接處理下一個顧客,當顧客吃完飯後會本身回來買單結帳的。
看到了吧,一樣是一個服務員也能夠同時處理多個顧客,這個服務員就至關於這裏的Event loop,即便這個event loop只運行在一個線程(進程)中也能夠同時處理多個用戶請求。
相信你已經對事件驅動編程有一個清晰的認知了,那麼接下來的問題就是事件驅動、事件驅動,那麼這個事件也就是event該怎麼獲取呢?
從《終於明白了,一文完全理解I/O多路複用》這篇文章中咱們知道,在Linux/Unix世界中一切皆文件,而咱們的程序都是經過文件描述符來進行I/O操做的,固然對於socket也不例外,那咱們該如何同時處理多個文件描述符呢?
IO多路複用技術正是用來解決這一問題的,經過IO多路複用技術,咱們一次能夠監控多個文件描述,當某個文件(socket)可讀或者可寫的時候咱們就能獲得通知啦。
這樣IO多路複用技術就成了event loop的發動機,源源不斷的給咱們提供各類event,這樣關於event來源就解決了。
固然關於IO多路複用技術的詳細講解請參見《終於明白了,一文完全理解I/O多路複用》。
至此,關於利用事件驅動來實現併發編程的全部問題都解決了嗎?event的來源問題解決了,當獲得event後調用相應的handler,看上去大功告成了。
想想還有沒有其它問題?
如今,咱們可使用一個線程(進程)就能基於事件驅動進行並行編程,再也沒有了多線程中讓人惱火的各類鎖、同步互斥、死鎖等問題了。
可是,計算機科學中歷來沒有出現過一種能解決全部問題的技術,如今沒有,在可預期的未來也不會有。
那上述方法有什麼問題嗎?
不要忘了,咱們event loop是運行在一個線程(進程),這雖然解決了多線程問題,可是若是在處理某個event時須要進行IO操做會怎麼樣呢?
在《讀取文件時,程序經歷了什麼》一文中,咱們講解了最經常使用的文件讀取在底層是如何實現的,程序員最經常使用的這種IO方式被稱爲阻塞式IO,也就是說,當咱們進行IO操做,好比讀取文件時,若是文件沒有讀取完成,那麼咱們的程序(線程)會被阻塞而暫停執行,這在多線程中不是問題,由於操做系統還能夠調度其它線程。
可是在單線程的event loop中是有問題的,緣由就在於當咱們在event loop中執行阻塞式IO操做時整個線程(event loop)會被暫停運行,這時操做系統將沒有其它線程能夠調用,由於系統中只有一個event loop在處理用戶請求,這樣當event loop線程被阻塞暫停運行時全部用戶請求都沒有辦法被處理,你能想象當服務器在處理其它用戶請求讀取數據庫致使你的請求被暫停嗎?
所以,在基於事件驅動編程時有一條注意事項,那就是不容許發起阻塞式IO。
有的同窗可能會問,若是不能發起阻塞式IO的話,那麼該怎樣進行IO操做呢?
有阻塞式IO,就有非阻塞式IO。
爲克服阻塞式IO所帶來的問題,現代操做系統開始提供一種新的發起IO請求的方法,這種方法就是異步IO,對於的,阻塞式IO就是同步IO,關於同步和異步這兩個概念參考《從小白到高手,你須要理解同步與異步》。
異步IO時,假設調用aio_read函數(具體的異步IO API請參考具體的操做系統平臺),也就是異步讀取,當咱們調用該函數後能夠當即返回,並繼續其它事情,雖然此時該文件可能尚未被讀取,這樣就不會阻塞調用線程了。此外,操做系統還會提供其它方法供調用線程來檢測IO操做是否完成。
就這樣,在操做系統的幫助下IO的阻塞調用問題也解決了。
雖然有異步IO來解決event loop可能被阻塞的問題,可是基於事件編程依然是困難的。
首先,咱們提到,event loop是運行在一個線程中的,顯然一個線程是沒有辦法充分利用多核資源的,有的同窗可能會說那就建立多個event loop實例不就能夠了,這樣就有多個event loop線程了,可是這樣一來多線程問題又會出現。
另外一點在於編程方面,在《從小白到高手,你須要理解同步與異步》這篇文章中咱們講到過,異步編程須要結合回調函數,這種編程方式須要把處理邏輯分爲兩部分,一部分調用方本身處理,另外一部分在回調函數中處理,這一編程方式的改變加劇了程序員在理解上的負擔,基於事件編程的項目後期會很難擴展以及維護。
那麼有沒有更好的方法呢?
要找到更好的方法,咱們須要解決問題的本質,那麼這個本質問題是什麼呢?
爲何咱們要使用異步這種難以理解的方式編程呢?
是由於阻塞式編程雖然容易理解但會致使線程被阻塞而暫停運行。
那麼聰明的你必定會問了,有沒有一種方法既能結合同步IO的簡單理解又不會因同步調用致使線程被阻塞呢?
雖然基於事件編程有這樣那樣的缺點,可是在當今的高性能高併發服務器上基於事件編程方式依然很是流行,但已經不是純粹的基於單一線程的事件驅動了,而是event loop + multi thread + user level thread。
關於這一組合,一樣值得拿出一篇文章來說解,咱們將在後續文章中詳細討論。
高併發技術從最開始的多進程一路演進到當前的事件驅動,計算機技術就像生物同樣也在不斷演變進化,但無論怎樣,瞭解歷史才能更深入的理解當下。但願這篇文章能對你們理解高併發服務器有所幫助。