物聯網高併發編程之網絡編程中的I/O模型

時間 2019-12-05

標籤聯網併發編程網絡模型欄目系統網絡简体版

原文原文鏈接

思惟導圖

互聯網服務端處理網絡請求的原理

首先看看一個典型互聯網服務端處理網絡請求的典型過程：編程

由上圖能夠看到，主要處理步驟包括：服務器

獲取請求數據，客戶端與服務器創建鏈接發出請求，服務器接受請求（1-3）；
構建響應，當服務器接收完請求，並在用戶空間處理客戶端的請求，直到構建響應完成（4）；
返回數據，服務器將已構建好的響應再經過內核空間的網絡 I/O 發還給客戶端（5-7）。

設計服務端併發模型時，主要有以下兩個關鍵點：網絡

服務器如何管理鏈接，獲取輸入數據；
服務器如何處理請求。

以上兩個關鍵點最終都與操做系統的 I/O 模型以及線程(進程)模型相關。下面先詳細介紹這I/O模型。多線程

I/O 模型的基本認識

介紹操做系統的 I/O 模型以前，先了解一下幾個概念：併發

阻塞調用與非阻塞調用；
阻塞調用是指調用結果返回以前，當前線程會被掛起，調用線程只有在獲得結果以後纔會返回；
非阻塞調用指在不能馬上獲得結果以前，該調用不會阻塞當前線程。

二者的最大區別在於被調用方在收到請求到返回結果以前的這段時間內，調用方是否一直在等待。異步

阻塞是指調用方一直在等待並且別的事情什麼都不作；非阻塞是指調用方先去忙別的事情。

同步處理與異步處理：同步處理是指被調用方獲得最終結果以後才返回給調用方；異步處理是指被調用方先返回應答，而後再計算調用結果，計算完最終結果後再通知並返回給調用方。
阻塞、非阻塞和同步、異步的區別（阻塞、非阻塞和同步、異步其實針對的對象是不同的）：

阻塞、非阻塞的討論對象是調用者；
同步、異步的討論對象是被調用者。

recvfrom 函數：

recvfrom 函數(經 Socket 接收數據)，這裏把它視爲系統調用。async

一個輸入操做一般包括兩個不一樣的階段：

等待數據準備好；
從內核向進程複製數據。

對於一個套接字上的輸入操做:

第一步一般涉及等待數據從網絡中到達。當所等待分組到達時，它被複制到內核中的某個緩衝區。函數

第二步就是把數據從內核緩衝區複製到應用進程緩衝區。高併發

實際應用程序在系統調用完成上面的 2 步操做時，調用方式的阻塞、非阻塞，操做系統在處理應用程序請求時，處理方式的同步、異步處理的不一樣，能夠分爲 5 種 I/O 模型。性能

I/O模型

I/O模型1：阻塞式 I/O 模型(blocking I/O）

在阻塞式 I/O 模型中，應用程序在從調用 recvfrom 開始到它返回有數據報準備好這段時間是阻塞的，recvfrom 返回成功後，應用進程開始處理數據報。

比喻：一我的在釣魚，當沒魚上鉤時，就坐在岸邊一直等。
優勢：程序簡單，在阻塞等待數據期間進程/線程掛起，基本不會佔用 CPU 資源。

缺點：每一個鏈接須要獨立的進程/線程單獨處理，當併發請求量大時爲了維護程序，內存、線程切換開銷較大，這種模型在實際生產中不多使用。

I/O模型2：非阻塞式 I/O 模型(non-blocking I/O）

在非阻塞式 I/O 模型中，應用程序把一個套接口設置爲非阻塞，就是告訴內核，當所請求的 I/O 操做沒法完成時，不要將進程睡眠。

而是返回一個錯誤，應用程序基於 I/O 操做函數將不斷的輪詢數據是否已經準備好，若是沒有準備好，繼續輪詢，直到數據準備好爲止。

比喻：邊釣魚邊玩手機，隔會再看看有沒有魚上鉤，有的話就迅速拉桿。
優勢：不會阻塞在內核的等待數據過程，每次發起的 I/O 請求能夠當即返回，不用阻塞等待，實時性較好

缺點：輪詢將會不斷地詢問內核，這將佔用大量的 CPU 時間，系統資源利用率較低，因此通常 Web 服務器不使用這種 I/O 模型。

I/O模型3：I/O 複用模型(I/O multiplexing）

在 I/O 複用模型中，會用到 Select 或 Poll 函數或 Epoll 函數(Linux 2.6 之後的內核開始支持)，這兩個函數也會使進程阻塞，可是和阻塞 I/O 有所不一樣。

這兩個函數能夠同時阻塞多個 I/O 操做，並且能夠同時對多個讀操做，多個寫操做的 I/O 函數進行檢測，直到有數據可讀或可寫時，才真正調用 I/O 操做函數。

比喻：放了一堆魚竿，在岸邊一直守着這堆魚竿，沒魚上鉤就玩手機。
優勢：能夠基於一個阻塞對象，同時在多個描述符上等待就緒，而不是使用多個線程(每一個文件描述符一個線程)，這樣能夠大大節省系統資源。

缺點：當鏈接數較少時效率相比多線程+阻塞 I/O 模型效率較低，可能延遲更大，由於單個鏈接處理須要 2 次系統調用，佔用時間會有增長。

衆所周之，Nginx這樣的高性能互聯網反向代理服務器大獲成功的關鍵就是得益於Epoll。