核心知識——JVMjava
jvm基本概念:算法
JVM 是可運行 Java 代碼的假想計算機 ,包括一套字節碼指令集、一組寄存器、一個棧、 一個垃圾回收,堆 和 一個存儲方法域JVM 是運行在操做系統之上的,它與硬件沒有直接 的交互。數組
運行過程:數據結構
咱們都知道 Java 源文件,經過編譯器,可以生產相應的.Class 文件,也就是字節碼文件, 而字節碼文件又經過 Java 虛擬機中的解釋器,編譯成特定機器上的機器碼 。多線程
也就是以下:併發
① Java 源文件—->編譯器—->字節碼文件異步
② 字節碼文件—->JVM—->機器碼jvm
每一種平臺的解釋器是不一樣的,可是實現的虛擬機是相同的,這也就是 Java 爲何可以 跨平臺的緣由了 ,當一個程序從開始運行,這時虛擬機就開始實例化了,多個程序啓動就會 存在多個虛擬機實例。程序退出或者關閉,則虛擬機實例消亡,多個虛擬機實例之間數據不能共享。 socket
2.1.線程async
這裏所說的線程指程序執行過程當中的一個線程實體。JVM 容許一個應用併發執行多個線程。 Hotspot JVM 中的 Java 線程與原生操做系統線程有直接的映射關係。當線程本地存儲、緩 衝區分配、同步對象、棧、程序計數器等準備好之後,就會建立一個操做系統原生線程。 Java 線程結束,原生線程隨之被回收。操做系統負責調度全部線程,並把它們分配到任何可 用的 CPU 上。當原生線程初始化完畢,就會調用 Java 線程的 run() 方法。當線程結束時,會釋放原生線程和 Java 線程的全部資源。
Hotspot JVM 後臺運行的系統線程主要有下面幾個:
2.2.JVM 內存區域
JVM 內存區域主要分爲線程私有區域【程序計數器、虛擬機棧、本地方法區】、線程共享區 域【JAVA 堆、方法區】、直接內存。 線程私有數據區域生命週期與線程相同, 依賴用戶線程的啓動/結束 而 建立/銷燬(在 Hotspot VM 內, 每一個線程都與操做系統的本地線程直接映射, 所以這部份內存區域的存/否跟隨本地線程的 生/死對應)。線程共享區域隨虛擬機的啓動/關閉而建立/銷燬。 直接內存並非 JVM 運行時數據區的一部分, 但也會被頻繁的使用: 在 JDK 1.4 引入的 NIO 提 供了基於 Channel 與 Buffer 的 IO 方式, 它可使用 Native 函數庫直接分配堆外內存, 而後使用 DirectByteBuffer 對象做爲這塊內存的引用進行操做(詳見: Java I/O 擴展), 這樣就避免了在 Java 堆和 Native 堆中來回複製數據, 所以在一些場景中能夠顯著提升性能。
2.2.1. 程序計數器(線程私有)
一塊較小的內存空間, 是當前線程所執行的字節碼的行號指示器,每條線程都要有一個獨立的 程序計數器,這類內存也稱爲「線程私有」的內存。 正在執行 java 方法的話,計數器記錄的是虛擬機字節碼指令的地址(當前指令的地址)。如 果仍是 Native 方法,則爲空。 這個內存區域是惟一一個在虛擬機中沒有規定任何 OutOfMemoryError 狀況的區域。
2.2.2. 虛擬機棧(線程私有)
是描述java方法執行的內存模型,每一個方法在執行的同時都會建立一個棧幀(Stack Frame) 用於存儲局部變量表、操做數棧、動態連接、方法出口等信息。每個方法從調用直至執行完成 的過程,就對應着一個棧幀在虛擬機棧中入棧到出棧的過程。 棧幀( Frame)是用來存儲數據和部分過程結果的數據結構,同時也被用來處理動態連接 (Dynamic Linking)、 方法返回值和異常分派( Dispatch Exception)。棧幀隨着方法調用而建立,隨着方法結束而銷燬——不管方法是正常完成仍是異常完成(拋出了在方法內未被捕獲的異 常)都算做方法結束。
2.2.3. 本地方法區(線程私有)
本地方法區和 Java Stack 做用相似, 區別是虛擬機棧爲執行 Java 方法服務, 而本地方法棧則爲 Native 方法服務, 若是一個 VM 實現使用 C-linkage 模型來支持 Native 調用, 那麼該棧將會是一個 C 棧,但 HotSpot VM 直接就把本地方法棧和虛擬機棧合二爲一。
2.2.4. 堆(Heap-線程共享)-運行時數據區
是被線程共享的一塊內存區域,建立的對象和數組都保存在 Java 堆內存中,也是垃圾收集器進行 垃圾收集的最重要的內存區域。因爲現代 VM 採用分代收集算法, 所以 Java 堆從 GC 的角度還能夠 細分爲: 新生代(Eden 區、From Survivor 區和 To Survivor 區)和老年代。
2.2.5. 方法區/永久代(線程共享)
即咱們常說的永久代(Permanent Generation), 用於存儲被 JVM 加載的類信息、常量、靜 態變量、即時編譯器編譯後的代碼等數據. HotSpot VM把GC分代收集擴展至方法區, 即便用Java 堆的永久代來實現方法區, 這樣 HotSpot 的垃圾收集器就能夠像管理 Java 堆同樣管理這部份內存, 而沒必要爲方法區開發專門的內存管理器(永久帶的內存回收的主要目標是針對常量池的回收和類型 的卸載, 所以收益通常很小)。 運行時常量池(Runtime Constant Pool)是方法區的一部分。Class 文件中除了有類的版 本、字段、方法、接口等描述等信息外,還有一項信息是常量池(Constant Pool Table),用於存放編譯期生成的各類字面量和符號引用,這部份內容將在類加 載後存放到方法區的運行時常量池中。 Java 虛擬機對 Class 文件的每一部分(天然也包括常量 池)的格式都有嚴格的規定,每個字節用於存儲哪一種數據都必須符合規範上的要求,這樣纔會 被虛擬機承認、裝載和執行。
2.3.JVM 運行時內存
Java 堆從 GC 的角度還能夠細分爲: 新生代(Eden 區、From Survivor 區和 To Survivor 區)和老年代。
2.3.1. 新生代
是用來存放新生的對象。通常佔據堆的 1/3 空間。因爲頻繁建立對象,因此新生代會頻繁觸發 MinorGC 進行垃圾回收。新生代又分爲 Eden 區、ServivorFrom、ServivorTo 三個區。
2.3.1.1. Eden 區
Java 新對象的出生地(若是新建立的對象佔用內存很大,則直接分配到老 年代)。當 Eden 區內存不夠的時候就會觸發 MinorGC,對新生代區進行 一次垃圾回收。
2.3.1.2. ServivorFrom
上一次 GC 的倖存者,做爲這一次 GC 的被掃描者。
2.3.1.3. ServivorTo
保留了一次 MinorGC 過程當中的倖存者。
2.3.1.4. MinorGC 的過程(複製->清空->互換)
MinorGC 採用複製算法。
1:eden、servicorFrom 複製到 ServicorTo,年齡+1
首先,把 Eden 和 ServivorFrom 區域中存活的對象複製到 ServicorTo 區域(若是有對象的年 齡以及達到了老年的標準,則賦值到老年代區),同時把這些對象的年齡+1(若是 ServicorTo 不夠位置了就放到老年區);
2:清空 eden、servicorFrom
而後,清空 Eden 和 ServicorFrom 中的對象;
3:ServicorTo 和 ServicorFrom 互換
最後,ServicorTo 和 ServicorFrom 互換,原 ServicorTo 成爲下一次 GC 時的 ServicorFrom區。
2.3.2. 老年代
主要存放應用程序中生命週期長的內存對象。 老年代的對象比較穩定,因此 MajorGC 不會頻繁執行。在進行 MajorGC 前通常都先進行 了一次 MinorGC,使得有新生代的對象晉身入老年代,致使空間不夠用時才觸發。當沒法找到足 夠大的連續空間分配給新建立的較大對象時也會提早觸發一次 MajorGC 進行垃圾回收騰出空間。 MajorGC 採用標記清除算法:首先掃描一次全部老年代,標記出存活的對象,而後回收沒 有標記的對象。MajorGC 的耗時比較長,由於要掃描再回收。MajorGC 會產生內存碎片,爲了減 少內存損耗,咱們通常須要進行合併或者標記出來方便下次直接分配。當老年代也滿了裝不下的 時候,就會拋出OOM(Out of Memory)異常。
2.3.3. 永久代
指內存的永久保存區域,主要存放 Class 和 Meta(元數據)的信息,Class 在被加載的時候被 放入永久區域,它和和存放實例的區域不一樣,GC 不會在主程序運行期對永久區域進行清理。因此這 也致使了永久代的區域會隨着加載的 Class 的增多而脹滿,最終拋出 OOM 異常。
2.3.3.1. JAVA8 與元數據
在 Java8 中,永久代已經被移除,被一個稱爲「元數據區」(元空間)的區域所取代。元空間 的本質和永久代相似,元空間與永久代之間最大的區別在於:元空間並不在虛擬機中,而是使用 本地內存。所以,默認狀況下,元空間的大小僅受本地內存限制。類的元數據放入 native memory, 字符串池和類的靜態變量放入 java 堆中,這樣能夠加載多少類的元數據就再也不由 MaxPermSize 控制, 而由系統的實際可用空間來控制。
2.4.垃圾回收與算法
2.4.1. 如何肯定垃圾
2.4.1.1. 引用計數法
在 Java 中,引用和對象是有關聯的。若是要操做對象則必須用引用進行。所以,很顯然一個簡單 的辦法是經過引用計數來判斷一個對象是否能夠回收。簡單說,即一個對象若是沒有任何與之關 聯的引用,即他們的引用計數都不爲 0,則說明對象不太可能再被用到,那麼這個對象就是可回收 對象。
2.4.1.2. 可達性分析
爲了解決引用計數法的循環引用問題,Java 使用了可達性分析的方法。經過一系列的「GC roots」 對象做爲起點搜索。若是在「GC roots」和一個對象之間沒有可達路徑,則稱該對象是不可達的。要注意的是,不可達對象不等價於可回收對象,不可達對象變爲可回收對象至少要通過兩次標記 過程。兩次標記後仍然是可回收對象,則將面臨回收。
2.4.2. 標記清除算法(Mark-Sweep)
最基礎的垃圾回收算法,分爲兩個階段,標註和清除。標記階段標記出全部須要回收的對象,清 除階段回收被標記的對象所佔用的空間。如圖
從圖中咱們就能夠發現,該算法最大的問題是內存碎片化嚴重,後續可能發生大對象不能找到可 利用空間的問題。
2.4.3. 複製算法(copying)
爲了解決 Mark-Sweep 算法內存碎片化的缺陷而被提出的算法。按內存容量將內存劃分爲等大小 的兩塊。每次只使用其中一塊,當這一塊內存滿後將尚存活的對象複製到另外一塊上去,把已使用 的內存清掉,如圖:
這種算法雖然實現簡單,內存效率高,不易產生碎片,可是最大的問題是可用內存被壓縮到了原 本的一半。且存活對象增多的話,Copying 算法的效率會大大下降。
2.4.4. 標記整理算法(Mark-Compact)
結合了以上兩個算法,爲了不缺陷而提出。標記階段和 Mark-Sweep 算法相同,標記後不是清 理對象,而是將存活對象移向內存的一端。而後清除端邊界外的對象。如圖:
2.4.5. 分代收集算法
分代收集法是目前大部分 JVM 所採用的方法,其核心思想是根據對象存活的不一樣生命週期將內存 劃分爲不一樣的域,通常狀況下將 GC 堆劃分爲老生代(Tenured/Old Generation)和新生代(Young Generation)。老生代的特色是每次垃圾回收時只有少許對象須要被回收,新生代的特色是每次垃 圾回收時都有大量垃圾須要被回收,所以能夠根據不一樣區域選擇不一樣的算法。
2.4.5.1. 新生代與複製算法
目前大部分 JVM 的 GC 對於新生代都採起 Copying 算法,由於新生代中每次垃圾回收都要 回收大部分對象,即要複製的操做比較少,但一般並非按照 1:1 來劃分新生代。通常將新生代 劃分爲一塊較大的 Eden 空間和兩個較小的 Survivor 空間(From Space, To Space),每次使用 Eden 空間和其中的一塊 Survivor 空間,當進行回收時,將該兩塊空間中還存活的對象複製到另 一塊 Survivor 空間中。
2.4.5.2. 老年代與標記複製算法
而老年代由於每次只回收少許對象,於是採用 Mark-Compact 算法。
1. JAVA 虛擬機提到過的處於方法區的永生代(Permanet Generation),它用來存儲 class 類, 常量,方法描述等。對永生代的回收主要包括廢棄常量和無用的類。
2. 對象的內存分配主要在新生代的 Eden Space 和 Survivor Space 的 From Space(Survivor 目 前存放對象的那一塊),少數狀況會直接分配到老生代。
3. 當新生代的 Eden Space 和 From Space 空間不足時就會發生一次 GC,進行 GC 後,Eden Space 和 From Space 區的存活對象會被挪到 To Space,而後將 Eden Space 和 From Space 進行清理。
4. 若是 To Space 沒法足夠存儲某個對象,則將這個對象存儲到老生代。
5. 在進行 GC 後,使用的即是 Eden Space 和 To Space 了,如此反覆循環。
6. 當對象在 Survivor 區躲過一次 GC 後,其年齡就會+1。默認狀況下年齡到達 15 的對象會被
2.5.1. 強引用
在 Java 中最多見的就是強引用,把一個對象賦給一個引用變量,這個引用變量就是一個強引 用。當一個對象被強引用變量引用時,它處於可達狀態,它是不可能被垃圾回收機制回收的,即 使該對象之後永遠都不會被用到 JVM 也不會回收。所以強引用是形成 Java 內存泄漏的主要緣由之 一。
2.5.2. 軟引用
軟引用須要用 SoftReference 類來實現,對於只有軟引用的對象來講,當系統內存足夠時它 不會被回收,當系統內存空間不足時它會被回收。軟引用一般用在對內存敏感的程序中。
2.5.3. 弱引用
弱引用須要用 WeakReference 類來實現,它比軟引用的生存期更短,對於只有弱引用的對象 來講,只要垃圾回收機制一運行,無論 JVM 的內存空間是否足夠,總會回收該對象佔用的內存。
2.5.4. 虛引用
虛引用須要 PhantomReference 類來實現,它不能單獨使用,必須和引用隊列聯合使用。虛 引用的主要做用是跟蹤對象被垃圾回收的狀態。
2.6.1. 分代收集算法
當前主流 VM 垃圾收集都採用」分代收集」(Generational Collection)算法, 這種算法會根據 對象存活週期的不一樣將內存劃分爲幾塊, 如 JVM 中的 新生代、老年代、永久代,這樣就能夠根據 各年代特色分別採用最適當的 GC 算法
2.6.1.1. 在新生代-複製算法
每次垃圾收集都能發現大批對象已死, 只有少許存活. 所以選用複製算法, 只須要付出少許 存活對象的複製成本就能夠完成收集.
2.6.1.2. 在老年代-標記整理算法
由於對象存活率高、沒有額外空間對它進行分配擔保, 就必須採用「標記—清理」或「標 記—整理」算法來進行回收, 沒必要進行內存複製, 且直接騰出空閒內存.
2.6.2. 分區收集算法
分區算法則將整個堆空間劃分爲連續的不一樣小區間, 每一個小區間獨立使用, 獨立回收. 這樣作的 好處是能夠控制一次回收多少個小區間 , 根據目標停頓時間, 每次合理地回收若干個小區間(而不是 整個堆), 從而減小一次 GC 所產生的停頓。
Java 堆內存被劃分爲新生代和年老代兩部分,新生代主要使用複製和標記-清除垃圾回收算法; 年老代主要使用標記-整理垃圾回收算法,所以 java 虛擬中針對新生代和年老代分別提供了多種不 同的垃圾收集器,JDK1.6 中 Sun HotSpot 虛擬機的垃圾收集器以下:
2.7.1. Serial 垃圾收集器(單線程、複製算法)
Serial(英文連續)是最基本垃圾收集器,使用複製算法,曾經是JDK1.3.1 以前新生代惟一的垃圾 收集器。Serial 是一個單線程的收集器,它不但只會使用一個 CPU 或一條線程去完成垃圾收集工 做,而且在進行垃圾收集的同時,必須暫停其餘全部的工做線程,直到垃圾收集結束。 Serial 垃圾收集器雖然在收集垃圾過程當中須要暫停全部其餘的工做線程,可是它簡單高效,對於限 定單個 CPU 環境來講,沒有線程交互的開銷,能夠得到最高的單線程垃圾收集效率,所以 Serial 垃圾收集器依然是 java 虛擬機運行在 Client 模式下默認的新生代垃圾收集器。
2.7.2. ParNew 垃圾收集器(Serial+多線程)
ParNew 垃圾收集器實際上是 Serial 收集器的多線程版本,也使用複製算法,除了使用多線程進行垃 圾收集以外,其他的行爲和 Serial 收集器徹底同樣,ParNew 垃圾收集器在垃圾收集過程當中一樣也 要暫停全部其餘的工做線程。13/04/2018 Page 32 of 283 ParNew 收集器默認開啓和 CPU 數目相同的線程數,能夠經過-XX:ParallelGCThreads 參數來限 制垃圾收集器的線程數。【Parallel:平行的】 ParNew雖然是除了多線程外和Serial 收集器幾乎徹底同樣,可是ParNew垃圾收集器是不少 java 虛擬機運行在 Server 模式下新生代的默認垃圾收集器。
2.7.3. Parallel Scavenge 收集器(多線程複製算法、高效)
Parallel Scavenge 收集器也是一個新生代垃圾收集器,一樣使用複製算法,也是一個多線程的垃 圾收集器,它重點關注的是程序達到一個可控制的吞吐量(Thoughput,CPU 用於運行用戶代碼 的時間/CPU 總消耗時間,即吞吐量=運行用戶代碼時間/(運行用戶代碼時間+垃圾收集時間)), 高吞吐量能夠最高效率地利用 CPU 時間,儘快地完成程序的運算任務,主要適用於在後臺運算而 不須要太多交互的任務。自適應調節策略也是 ParallelScavenge 收集器與 ParNew 收集器的一個 重要區別。
2.7.4. Serial Old 收集器(單線程標記整理算法 )
Serial Old 是 Serial 垃圾收集器年老代版本,它一樣是個單線程的收集器,使用標記-整理算法, 這個收集器也主要是運行在 Client 默認的 java 虛擬機默認的年老代垃圾收集器。 在 Server 模式下,主要有兩個用途:
1. 在 JDK1.5 以前版本中與新生代的 Parallel Scavenge 收集器搭配使用。
2. 做爲年老代中使用 CMS 收集器的後備垃圾收集方案。
新生代 Serial 與年老代 Serial Old 搭配垃圾收集過程圖:
新生代 Parallel Scavenge 收集器與 ParNew 收集器工做原理相似,都是多線程的收集器,都使 用的是複製算法,在垃圾收集過程當中都須要暫停全部的工做線程。新生代 Parallel Scavenge/ParNew 與年老代 Serial Old 搭配垃圾收集過程圖:
2.7.5. Parallel Old 收集器(多線程標記整理算法)
Parallel Old 收集器是Parallel Scavenge的年老代版本,使用多線程的標記-整理算法,在 JDK1.6 纔開始提供。 在 JDK1.6 以前,新生代使用 ParallelScavenge 收集器只能搭配年老代的 Serial Old 收集器,只 能保證新生代的吞吐量優先,沒法保證總體的吞吐量,Parallel Old 正是爲了在年老代一樣提供吞 吐量優先的垃圾收集器,若是系統對吞吐量要求比較高,能夠優先考慮新生代 Parallel Scavenge 和年老代 Parallel Old 收集器的搭配策略。 新生代 Parallel Scavenge 和年老代 Parallel Old 收集器搭配運行過程圖:
2.7.6. CMS 收集器(多線程標記清除算法)
Concurrent mark sweep(CMS)收集器是一種年老代垃圾收集器,其最主要目標是獲取最短垃圾 回收停頓時間,和其餘年老代使用標記-整理算法不一樣,它使用多線程的標記-清除算法。 最短的垃圾收集停頓時間能夠爲交互比較高的程序提升用戶體驗。 CMS 工做機制相比其餘的垃圾收集器來講更復雜,整個過程分爲如下 4 個階段:
2.7.6.1. 初始標記
只是標記一下 GC Roots 能直接關聯的對象,速度很快,仍然須要暫停全部的工做線程。
2.7.6.2. 併發標記
進行 GC Roots 跟蹤的過程,和用戶線程一塊兒工做,不須要暫停工做線程。
2.7.6.3. 從新標記
爲了修正在併發標記期間,因用戶程序繼續運行而致使標記產生變更的那一部分對象的標記 記錄,仍然須要暫停全部的工做線程。
2.7.6.4. 併發清除
清除 GC Roots 不可達對象,和用戶線程一塊兒工做,不須要暫停工做線程。因爲耗時最長的並 發標記和併發清除過程當中,垃圾收集線程能夠和用戶如今一塊兒併發工做,因此整體上來看 CMS 收集器的內存回收和用戶線程是一塊兒併發地執行。 CMS 收集器工做過程:
2.7.7. G1 收集器
Garbage first 垃圾收集器是目前垃圾收集器理論發展的最前沿成果,相比與 CMS 收集器,G1 收 集器兩個最突出的改進是:
1. 基於標記-整理算法,不產生內存碎片。
2. 能夠很是精確控制停頓時間,在不犧牲吞吐量前提下,實現低停頓垃圾回收。
G1 收集器避免全區域垃圾收集,它把堆內存劃分爲大小固定的幾個獨立區域,而且跟蹤這些區域 的垃圾收集進度,同時在後臺維護一個優先級列表,每次根據所容許的收集時間,優先回收垃圾 最多的區域。區域劃分和優先級區域回收機制,確保 G1 收集器能夠在有限時間得到最高的垃圾收 集效率。
2.8. JAVA IO/NIO
2.8.1. 阻塞 IO 模型
最傳統的一種 IO 模型,即在讀寫數據過程當中會發生阻塞現象。當用戶線程發出 IO 請求以後,內 核會去查看數據是否就緒,若是沒有就緒就會等待數據就緒,而用戶線程就會處於阻塞狀態,用 戶線程交出 CPU。當數據就緒以後,內核會將數據拷貝到用戶線程,並返回結果給用戶線程,用戶線程才解除 block 狀態。典型的阻塞 IO 模型的例子爲:data = socket.read();若是數據沒有就 緒,就會一直阻塞在 read 方法。
2.8.2. 非阻塞 IO 模型
當用戶線程發起一個 read 操做後,並不須要等待,而是立刻就獲得了一個結果。若是結果是一個 error 時,它就知道數據尚未準備好,因而它能夠再次發送 read 操做。一旦內核中的數據準備 好了,而且又再次收到了用戶線程的請求,那麼它立刻就將數據拷貝到了用戶線程,而後返回。 因此事實上,在非阻塞 IO 模型中,用戶線程須要不斷地詢問內核數據是否就緒,也就說非阻塞 IO不會交出 CPU,而會一直佔用 CPU。典型的非阻塞 IO 模型通常以下:
可是對於非阻塞 IO 就有一個很是嚴重的問題,在 while 循環中須要不斷地去詢問內核數據是否就 緒,這樣會致使 CPU 佔用率很是高,所以通常狀況下不多使用 while 循環這種方式來讀取數據。
2.8.3. 多路複用 IO 模型
多路複用 IO 模型是目前使用得比較多的模型。Java NIO 實際上就是多路複用 IO。在多路複用 IO 模型中,會有一個線程不斷去輪詢多個 socket 的狀態,只有當 socket 真正有讀寫事件時,才真 正調用實際的 IO 讀寫操做。由於在多路複用 IO 模型中,只須要使用一個線程就能夠管理多個 socket,系統不須要創建新的進程或者線程,也沒必要維護這些線程和進程,而且只有在真正有 socket 讀寫事件進行時,纔會使用 IO 資源,因此它大大減小了資源佔用。在 Java NIO 中,是通 過 selector.select()去查詢每一個通道是否有到達事件,若是沒有事件,則一直阻塞在那裏,所以這 種方式會致使用戶線程的阻塞。多路複用 IO 模式,經過一個線程就能夠管理多個 socket,只有當 socket 真正有讀寫事件發生纔會佔用資源來進行實際的讀寫操做。所以,多路複用 IO 比較適合連 接數比較多的狀況。
另外多路複用 IO 爲什麼比非阻塞 IO 模型的效率高是由於在非阻塞 IO 中,不斷地詢問 socket 狀態 時經過用戶線程去進行的,而在多路複用 IO 中,輪詢每一個 socket 狀態是內核在進行的,這個效 率要比用戶線程要高的多。
不過要注意的是,多路複用 IO 模型是經過輪詢的方式來檢測是否有事件到達,而且對到達的事件 逐一進行響應。所以對於多路複用 IO 模型來講,一旦事件響應體很大,那麼就會致使後續的事件 遲遲得不處處理,而且會影響新的事件輪詢。
2.8.4. 信號驅動 IO 模型
在信號驅動 IO 模型中,當用戶線程發起一個 IO 請求操做,會給對應的 socket 註冊一個信號函 數,而後用戶線程會繼續執行,當內核數據就緒時會發送一個信號給用戶線程,用戶線程接收到 信號以後,便在信號函數中調用 IO 讀寫操做來進行實際的 IO 請求操做。
2.8.5. 異步 IO 模型
異步 IO 模型纔是最理想的 IO 模型,在異步 IO 模型中,當用戶線程發起 read 操做以後,馬上就 能夠開始去作其它的事。而另外一方面,從內核的角度,當它受到一個 asynchronous read 以後, 它會馬上返回,說明 read 請求已經成功發起了,所以不會對用戶線程產生任何 block。而後,內 核會等待數據準備完成,而後將數據拷貝到用戶線程,當這一切都完成以後,內核會給用戶線程 發送一個信號,告訴它 read 操做完成了。也就說用戶線程徹底不須要實際的整個 IO 操做是如何 進行的,只須要先發起一個請求,當接收內核返回的成功信號時表示 IO 操做已經完成,能夠直接 去使用數據了。
也就說在異步 IO 模型中,IO 操做的兩個階段都不會阻塞用戶線程,這兩個階段都是由內核自動完 成,而後發送一個信號告知用戶線程操做已完成。用戶線程中不須要再次調用 IO 函數進行具體的 讀寫。這點是和信號驅動模型有所不一樣的,在信號驅動模型中,當用戶線程接收到信號表示數據 已經就緒,而後須要用戶線程調用 IO 函數進行實際的讀寫操做;而在異步 IO 模型中,收到信號 表示 IO 操做已經完成,不須要再在用戶線程中調用 IO 函數進行實際的讀寫操做。
看到這裏還沒過癮,或者對以上技術點有任何疑問的,那麼就來羣裏與更多的大佬交流切磋技術,戳這裏:我們來一塊兒抱團取暖,好嗎?