高性能網絡通信原理

時間 2019-11-24

標籤高性能網絡通信原理欄目系統網絡简体版

原文原文鏈接

目錄html

高性能網絡通信原理

高性能網絡通信原理

前言

原本想對netty的源碼進行學習和探究，可是在寫netty以前許多底層的知識和原理性的東西理解清楚，那麼對學習網絡通信框架的效果則會事半功倍。react

本篇主要探討高性能網絡通信框架的一些必要知識和底層操做系統相關的原理。在探討如何作以前，咱們先討論下爲何要作。linux

隨着互聯網的高速發展，用戶量呈指數形式遞增，從原來的PC普及到如今的移動設備普及。用戶量都是千萬甚至億爲單位計算，尤爲是實時通信軟件，在線實時互動的應用出現，在線用戶數從原來的幾十上百到後來的上萬甚至上千萬。單臺服務的性能瓶頸和網絡通信瓶頸慢慢呈現。應用架構從單應用到應用數據分離，再到分佈式集羣高可用架構。單臺服務的性能不足能夠經過構建服務集羣的方式水平擴展，應用性能瓶頸被很好的解決。可是橫向擴展帶來了直接的經濟成本。編程

一個高性能的網絡通信框架從硬件設備到操做系統內核以及用戶模式都須要精心設計。從底層的I/O訪問，到操做系統內核的I/O模型，線程調度以及用戶框架都須要精心設計，只要有任何地方有疏漏都會出現短板效應。windows

I/O訪問

當咱們在讀取socket數據時，雖然咱們在代碼僅僅是調用了一個Read操做，可是實際操做系統層面作了許多事情。首先操做系統須要從用戶模式轉換爲內核模式，處理器會經過網卡驅動對網卡控制器進行操做，網卡控制器則控制網卡。數組

處理器不會直接操控硬件。緩存

爲了提升CPU利用率，I/O訪問方式也發生了很大變化。服務器

早期的CPU直接控制外圍設備，後來增長了控制器或I/O模塊。處理器經過向I/O模塊發送命令執行I/O指令。然而可編程I/O並不會通知處理器I/O，所以處理器須要定時檢查I/O模塊的狀態，它會進行忙等待，所以效率並不高。
後來CPU支持了中斷方式，處理器無需等待執行I/O操做，經過中斷控制器產生中斷信號通知I/O操做完成，大大的提升了處理器利用效率。這時的I/O操做使用特定的in/out(I/O端口)指令或直接讀寫內存的方式(內存映射I/O)。可是這些方式都須要處理器使用I/O寄存器逐個內存單元進行訪問，效率並不高，在I/O操做時須要消耗的CPU時鐘週期。
爲了提升效率，後來增長了DMA控制器，它能夠模擬處理起得到內存總線控制權，進行I/O的讀寫。當處理器將控制權交給DMA控制器以後，DMA處理器會先讓I/O硬件設備將數據放到I/O硬件的緩衝區中，而後DMA控制器就能夠開始傳輸數據了。在此過程當中處理器無需消耗時鐘週期。當DMA操做完成時，會經過中斷操做通知處理器。

I/O訪問的發展趨勢是儘量減小處理器干涉I/O操做，讓CPU從I/O任務中解脫出來，讓處理器能夠去作其餘事情，從而提升性能。網絡

對於I/O訪問感興趣的同窗能夠看《操做系統精髓與設計原理(第5版)》第十一章I/O管理相關內容和《WINDOWS內核原理與實現》第六章I/O論述相關內容架構

I/O模型

在討論I/O模型以前，首先引出一個叫作C10K的問題。在早期的I/O模型使用的是同步阻塞模型，當接收到一個新的TCP鏈接時，就須要分配一個線程。所以隨着鏈接增長線程增多，頻繁的內存複製，上下文切換帶來的性能損耗致使性能不佳。所以如何使得單機網絡併發鏈接數達到10K成爲通信開發者熱門的討論話題。

同步阻塞

前面提到，在最原始的I/O模型中，對文件設備數據的讀寫須要同步等待操做系統內核，即便文件設備並無數據可讀，線程也會被阻塞住，雖然阻塞時不佔用CPU始終週期，可是若須要支持併發鏈接，則必須啓用大量的線程，即每一個鏈接一個線程。這樣必不可少的會形成線程大量的上下文切換，隨着併發量的增高，性能愈來愈差。

select模型/poll模型

爲了解決同步阻塞帶來線程過多致使的性能問題，同步非阻塞方案產生。經過一個線程不斷的判斷文件句柄數組是否有準備就緒的文件設備，這樣就不須要每一個線程同步等待，減小了大量線程，下降了線程上下文切換帶來的性能損失，提升了線程利用率。這種方式也稱爲I/O多路複用技術。可是因爲數組是有數組長度上限的(linux默認是1024)，並且select模型須要對數組進行遍歷，所以時間複雜度是\(O_{(n)}\)所以當高併發量的時候，select模型性能會愈來愈差。

poll模型和select模型相似，可是它使用鏈表存儲而非數組存儲，解決了併發上限的限制，可是並無解決select模型的高併發性能底下的根本問題。

epoll模型

在linux2.6支持了epoll模型，epoll模型解決了select模型的性能瓶頸問題。它經過註冊回調事件的方式，當數據可讀寫時，將其加入到經過回調方式，將其加入到一個可讀寫事件的隊列中。這樣每次用戶獲取時不須要遍歷全部句柄，時間複雜度下降爲\(O_{(1)}\)。所以epoll不會隨着併發量的增長而性能下降。隨着epoll模型的出現C10K的問題已經完美解決。

異步I/O模型

前面講的幾種模型都是同步I/O模型，異步I/O模型指的是發生數據讀寫時徹底不一樣步阻塞等待，換句話來講就是數據從網卡傳輸到用戶空間的過程時徹底異步的，不用阻塞CPU。爲了更詳細的說明同步I/O與異步I/O的區別，接下來舉一個實際例子。

當應用程序須要從網卡讀取數據時，首先須要分配一個用戶內存空間用來保存須要讀取的數據。操做系統內核會調用網卡緩衝區讀取數據到內核空間的緩衝區，而後再複製到用戶空間。在這個過程當中，同步阻塞I/O在數據讀取到用戶空間以前都會被阻塞，同步非阻塞I/O只知道數據已就緒，可是從內核空間緩衝區拷貝到用戶空間時，線程依然會被阻塞。而異步I/O模型在接收到I/O完成通知時，數據已經傳輸到用戶空間。所以整個I/O操做都是徹底異步的，所以異步I/O模型的性能是最佳的。