Java新一代網絡編程模型AIO原理及Linux系統AIO介紹

前言


從JDK 7版本開始,Java新加入的文件和網絡io特性稱爲nio2(new io 2, 由於jdk1.4中已經有過一個nio了),包含了衆多性能和功能上的改進,其中最重要的部分,就是對異步io的支持,稱爲Java AIO(asynchronous IO)。

由於AIO的實施需充分調用OS參與,IO須要操做系統支持、併發也一樣須要操做系統的支持,因此性能方面不一樣操做系統差別會比較明顯。因此本文也附帶介紹了Linux 2.6及之後版本新增的AIO特性(由於這跟Java AIO是對應關係)。

Java AIO


1基本原理


目前爲止,Java共支持3種網絡編程模型:BIO、NIO、AIO:

  • Java BIO : 同步並阻塞,服務器實現模式爲一個鏈接一個線程,即客戶端有鏈接請求時服務器端就須要啓動一個線程進行處理,若是這個鏈接不作任何事情會形成沒必要要的線程開銷,固然能夠經過線程池機制改善。
  • Java NIO : 同步非阻塞,服務器實現模式爲一個請求一個線程,即客戶端發送的鏈接請求都會註冊到多路複用器上,多路複用器輪詢到鏈接有I/O請求時才啓動一個線程進行處理。
  • Java AIO(NIO.2) : 異步非阻塞,服務器實現模式爲一個有效請求一個線程,客戶端的I/O請求都是由OS先完成了再通知服務器應用去啓動線程進行處理。

BIO、NIO、AIO適用場景分析:

  • BIO方式適用於鏈接數目比較小且固定的架構,這種方式對服務器資源要求比較高,併發侷限於應用中,JDK1.4之前的惟一選擇,但程序直觀簡單易理解。
  • NIO方式適用於鏈接數目多且鏈接比較短(輕操做)的架構,好比聊天服務器,併發侷限於應用中,編程比較複雜,JDK1.4開始支持。
  • AIO方式使用於鏈接數目多且鏈接比較長(重操做)的架構,好比相冊服務器,充分調用OS參與併發操做,編程比較複雜,JDK7開始支持。

2AIO介紹


jdk在1.4版本的nio中提供了對非阻塞多路複用同步io模型的支持,可是在Windows上是基於較低效select/poll實現的。

jdk1.7中提供對aio的支持後,帶來了兩方面的好處:

  • Windows上可使用iocp了。
  • 簡化了網絡變成模型。異步io相比較非阻塞多路複用模型更易理解,開發更爲簡單。

和多路複用的java nio相比較,能夠發現,異步io是在數據讀取或者寫入調用已經完成的時候,再通知調用者,而非阻塞多路複用io則是在有數據就緒,能夠讀寫的時候通知調用者,讀寫仍然是由調用者執行而且是阻塞的(這意味着若是要同時進行其餘工做,要控制讀寫操做不能阻塞太長時間或者須要將其放去單獨的io線程執行)。

JDK7中的java aio新增的類和接口主要有:

  • AsynchronousServerSocketChannel ,對應於bio中的ServerSocket和nio中的ServerSocketChannel,用於server端的網絡程序。
  • AsynchronousSocketChannel,對雲關於bio中的Socket和nio中的SocketChannel,用於client端的網絡程序。
  • CompletionHandler,回調接口,在socket進行accept/connect/read/write等操做時,能夠傳入一個CompletionHandler的實現,操做執行完畢後,會調用註冊的CompletionHandler。

除了CompletionHandler這種回調方式,aio中還支持返回Future對象,使用Future來設定回調操做。

Linux AIO


1Linux AIO 簡介


Linux 異步 I/O 是 Linux 內核中提供的一個至關新的加強。它是 2.6 版本內核的一個標準特性,可是咱們在 2.4 版本內核的補丁中也能夠找到它。AIO 背後的基本思想是容許進程發起不少 I/O 操做,而不用阻塞或等待任何操做完成。稍後或在接收到 I/O 操做完成的通知時,進程就能夠檢索 I/O 操做的結果。

2Linux 的 I/O 模型


在深刻介紹 AIO API 以前,讓咱們先來探索一下 Linux 上可使用的不一樣 I/O 模型。這並非一個詳盡的介紹,可是咱們將試圖介紹最經常使用的一些模型來解釋它們與異步 I/O 之間的區別。圖 1 給出了同步和異步模型,以及阻塞和非阻塞的模型。

基本 Linux I/O 模型的簡單矩陣:
Java新一代網絡編程模型AIO原理及Linux系統AIO介紹_a.gif 

每一個 I/O 模型都有本身的使用模式,它們對於特定的應用程序都有本身的優勢。

同步阻塞 I/O:
以下圖所示:傳統的阻塞 I/O 模型,這也是目前應用程序中最爲經常使用的一種模型。其行爲很是容易理解,其用法對於典型的應用程序來講都很是有效。在調用 read 系統調用時,應用程序會阻塞並對內核進行上下文切換。而後會觸發讀操做,當響應返回時(從咱們正在從中讀取的設備中返回),數據就被移動到用戶空間的緩衝區中。而後應用程序就會解除阻塞(read 調用返回)。
Java新一代網絡編程模型AIO原理及Linux系統AIO介紹_QQ20160514-0.png 
從應用程序的角度來講,read 調用會延續很長時間。實際上,在內核執行讀操做和其餘工做時,應用程序的確會被阻塞。

同步非阻塞 I/O:
同步阻塞 I/O 的一種效率稍低的變種是同步非阻塞 I/O。在這種模型中,設備是以非阻塞的形式打開的。這意味着 I/O 操做不會當即完成,read 操做可能會返回一個錯誤代碼,說明這個命令不能當即知足(EAGAIN 或 EWOULDBLOCK),以下圖所示。
Java新一代網絡編程模型AIO原理及Linux系統AIO介紹_c.gif 
非阻塞的實現是 I/O 命令可能並不會當即知足,須要應用程序調用許屢次來等待操做完成。這可能效率不高,由於在不少狀況下,當內核執行這個命令時,應用程序必需要進行忙碌等待,直到數據可用爲止,或者試圖執行其餘工做。正如圖 3 所示的同樣,這個方法能夠引入 I/O 操做的延時,由於數據在內核中變爲可用到用戶調用 read 返回數據之間存在必定的間隔,這會致使總體數據吞吐量的下降。

異步阻塞 I/O:
另一個阻塞解決方案是帶有阻塞通知的非阻塞 I/O。在這種模型中,配置的是非阻塞 I/O,而後使用阻塞 select 系統調用來肯定一個 I/O 描述符什麼時候有操做。使 select 調用很是有趣的是它能夠用來爲多個描述符提供通知,而不只僅爲一個描述符提供通知。對於每一個提示符來講,咱們能夠請求這個描述符能夠寫數據、有讀數據可用以及是否發生錯誤的通知。
Java新一代網絡編程模型AIO原理及Linux系統AIO介紹_QQ20160514-1.png 
select 調用的主要問題是它的效率不是很是高。儘管這是異步通知使用的一種方便模型,可是對於高性能的 I/O 操做來講不建議使用。

異步非阻塞 I/O(AIO):
最後,異步非阻塞 I/O 模型是一種處理與 I/O 重疊進行的模型。讀請求會當即返回,說明 read 請求已經成功發起了。在後臺完成讀操做時,應用程序而後會執行其餘處理操做。當 read 的響應到達時,就會產生一個信號或執行一個基於線程的回調函數來完成此次 I/O 處理過程。
Java新一代網絡編程模型AIO原理及Linux系統AIO介紹_e.gif 
在一個進程中爲了執行多個 I/O 請求而對計算操做和 I/O 處理進行重疊處理的能力利用了處理速度與 I/O 速度之間的差別。當一個或多個 I/O 請求掛起時,CPU 能夠執行其餘任務;或者更爲常見的是,在發起其餘 I/O 的同時對已經完成的 I/O 進行操做。

3異步 I/O(AIO) 的動機


從前面 I/O 模型的分類中,咱們能夠看出 AIO 的動機。這種阻塞模型須要在 I/O 操做開始時阻塞應用程序。這意味着不可能同時重疊進行處理和 I/O 操做。同步非阻塞模型容許處理和 I/O 操做重疊進行,可是這須要應用程序根據重現的規則來檢查 I/O 操做的狀態。這樣就剩下異步非阻塞 I/O 了,它容許處理和 I/O 操做重疊進行,包括 I/O 操做完成的通知。

除了須要阻塞以外,select 函數所提供的功能(異步阻塞 I/O)與 AIO 相似。不過,它是對通知事件進行阻塞,而不是對 I/O 調用進行阻塞。

總結


使用異步 I/O(AIO)能夠幫助咱們構建 I/O 速度更快、效率更高的應用程序。若是咱們的應用程序能夠對處理和 I/O 操做重疊進行,那麼 AIO 就能夠幫助咱們構建能夠更高效地使用可用 CPU 資源的應用程序。

儘管這種 I/O 模型與在大部分 Linux 應用程序中使用的傳統阻塞模式都不一樣,可是異步通知模型在概念上來講卻很是簡單,能夠簡化咱們的設計。

更多資料


更多網絡編程資料:http://www.52im.net/forum.php?mod=collection&action=view&ctid=8

一篇提到AIO的大型應用架構實踐的文章:http://www.52im.net/thread-304-1-1.htmlphp

原文章地址:http://www.52im.net/thread-306-1-1.htmlhtml