一文理解:Java NIO 核心組件


背景知識

同步、異步、阻塞、非阻塞

首先,這幾個概念很是容易搞混淆,但NIO中又有涉及,因此總結一下。php

  • 同步:API調用返回時調用者就知道操做的結果如何了(實際讀取/寫入了多少字節)。
  • 異步:相對於同步,API調用返回時調用者不知道操做的結果,後面纔會回調通知結果。
  • 阻塞:當無數據可讀,或者不能寫入全部數據時,掛起當前線程等待。
  • 非阻塞:讀取時,能夠讀多少數據就讀多少而後返回,寫入時,能夠寫入多少數據就寫入多少而後返回。

對於I/O操做,根據Oracle官網的文檔,同步異步的劃分標準是「調用者是否須要等待I/O操做完成」,這個「等待I/O操做完成」的意思不是指必定要讀取到數據或者說寫入全部數據,而是指真正進行I/O操做時,好比數據在TCP/IP協議棧緩衝區和JVM緩衝區之間傳輸的這段時間,調用者是否要等待。html

因此,咱們經常使用的 read() 和 write() 方法都是同步I/O,同步I/O又分爲阻塞和非阻塞兩種模式,若是是非阻塞模式,檢測到無數據可讀時,直接就返回了,並無真正執行I/O操做。java

總結就是,Java中實際上只有 同步阻塞I/O、同步非阻塞I/O 與 異步I/O 三種機制,咱們下文所說的是前兩種,JDK 1.7纔開始引入異步 I/O,那稱之爲NIO.2。程序員

傳統IO

咱們知道,一個新技術的出現老是伴隨着改進和提高,Java NIO的出現亦如此。編程

傳統 I/O 是阻塞式I/O,主要問題是系統資源的浪費。好比咱們爲了讀取一個TCP鏈接的數據,調用 InputStream 的 read() 方法,這會使當前線程被掛起,直到有數據到達才被喚醒,那該線程在數據到達這段時間內,佔用着內存資源(存儲線程棧)卻無所做爲,也就是俗話說的佔着茅坑不拉屎,爲了讀取其餘鏈接的數據,咱們不得不啓動另外的線程。在併發鏈接數量很少的時候,這可能沒什麼問題,然而當鏈接數量達到必定規模,內存資源會被大量線程消耗殆盡。另外一方面,線程切換須要更改處理器的狀態,好比程序計數器、寄存器的值,所以很是頻繁的在大量線程之間切換,一樣是一種資源浪費。api

隨着技術的發展,現代操做系統提供了新的I/O機制,能夠避免這種資源浪費。基於此,誕生了Java NIO,NIO的表明性特徵就是非阻塞I/O。緊接着咱們發現,簡單的使用非阻塞I/O並不能解決問題,由於在非阻塞模式下,read()方法在沒有讀取到數據時就會當即返回,不知道數據什麼時候到達的咱們,只能不停的調用read()方法進行重試,這顯然太浪費CPU資源了,從下文能夠知道,Selector組件正是爲解決此問題而生。數組

Java NIO 核心組件

1.Channel

概念服務器

Java NIO中的全部I/O操做都基於Channel對象,就像流操做都要基於Stream對象同樣,所以頗有必要先了解Channel是什麼。如下內容摘自JDK 1.8的文檔網絡

A channel represents an open connection to an entity such as a hardware device, a file, a network socket, or a program component that is capable of performing one or more distinct I/O operations, for example reading or writing.多線程

從上述內容可知,一個Channel(通道)表明和某一實體的鏈接,這個實體能夠是文件、網絡套接字等。也就是說,通道是Java NIO提供的一座橋樑,用於咱們的程序和操做系統底層I/O服務進行交互。

通道是一種很基本很抽象的描述,和不一樣的I/O服務交互,執行不一樣的I/O操做,實現不同,所以具體的有FileChannel、SocketChannel等。加羣895244712,免費獲取Java架構師進階學習資料

通道使用起來跟Stream比較像,能夠讀取數據到Buffer中,也能夠把Buffer中的數據寫入通道。

固然,也有區別,主要體如今以下兩點:

  • 一個通道,既能夠讀又能夠寫,而一個Stream是單向的(因此分 InputStream 和 OutputStream)
  • 通道有非阻塞I/O模式

實現

Java NIO中最經常使用的通道實現是以下幾個,能夠看出跟傳統的 I/O 操做類是一一對應的。

  • FileChannel:讀寫文件
  • DatagramChannel: UDP協議網絡通訊
  • SocketChannel:TCP協議網絡通訊
  • ServerSocketChannel:監聽TCP鏈接

2.Buffer

NIO中所使用的緩衝區不是一個簡單的byte數組,而是封裝過的Buffer類,經過它提供的API,咱們能夠靈活的操縱數據,下面細細道來。

與Java基本類型相對應,NIO提供了多種 Buffer 類型,如ByteBuffer、CharBuffer、IntBuffer等,區別就是讀寫緩衝區時的單位長度不同(以對應類型的變量爲單位進行讀寫)。

Buffer中有3個很重要的變量,它們是理解Buffer工做機制的關鍵,分別是

  • capacity (總容量)
  • position (指針當前位置)
  • limit (讀/寫邊界位置)

Buffer的工做方式跟C語言裏的字符數組很是的像,類比一下,capacity就是數組的總長度,position就是咱們讀/寫字符的下標變量,limit就是結束符的位置。Buffer初始時3個變量的狀況以下圖

在對Buffer進行讀/寫的過程當中,position會日後移動,而 limit 就是 position 移動的邊界。由此不難想象,在對Buffer進行寫入操做時,limit應當設置爲capacity的大小,而對Buffer進行讀取操做時,limit應當設置爲數據的實際結束位置。(注意:將Buffer數據 寫入 通道是Buffer 讀取 操做,從通道 讀取 數據到Buffer是Buffer 寫入 操做)

在對Buffer進行讀/寫操做前,咱們能夠調用Buffer類提供的一些輔助方法來正確設置 position 和 limit 的值,主要有以下幾個

  • flip(): 設置 limit 爲 position 的值,而後 position 置爲0。對Buffer進行讀取操做前調用。
  • rewind(): 僅僅將 position 置0。通常是在從新讀取Buffer數據前調用,好比要讀取同一個Buffer的數據寫入多個通道時會用到。
  • clear(): 回到初始狀態,即 limit 等於 capacity,position 置0。從新對Buffer進行寫入操做前調用。
  • compact(): 將未讀取完的數據(position 與 limit 之間的數據)移動到緩衝區開頭,並將 position 設置爲這段數據末尾的下一個位置。其實就等價於從新向緩衝區中寫入了這麼一段數據。

而後,看一個實例,使用 FileChannel 讀寫文本文件,經過這個例子驗證通道可讀可寫的特性以及Buffer的基本用法(注意 FileChannel 不能設置爲非阻塞模式)。

FileChannel channel = new RandomAccessFile("test.txt", "rw").getChannel();
    channel.position(channel.size());  // 移動文件指針到末尾(追加寫入)
    
    ByteBuffer byteBuffer = ByteBuffer.allocate(20);
    
    // 數據寫入Buffer
    byteBuffer.put("你好,世界!\n".getBytes(StandardCharsets.UTF_8));
 
    // Buffer -> Channel
    byteBuffer.flip();
    while (byteBuffer.hasRemaining()) {
        channel.write(byteBuffer);
    }
 
    channel.position(0); // 移動文件指針到開頭(從頭讀取)
    CharBuffer charBuffer = CharBuffer.allocate(10);
    CharsetDecoder decoder = StandardCharsets.UTF_8.newDecoder();
 
    // 讀出全部數據
    byteBuffer.clear();
    while (channel.read(byteBuffer) != -1 || byteBuffer.position() > 0) {
        byteBuffer.flip();
 
        // 使用UTF-8解碼器解碼
        charBuffer.clear();
        decoder.decode(byteBuffer, charBuffer, false);
        System.out.print(charBuffer.flip().toString());
 
        byteBuffer.compact(); // 數據可能有剩餘
    }
    加羣895244712,免費獲取Java架構師進階學習資料
    channel.close();

複製代碼

這個例子中使用了兩個Buffer,其中 byteBuffer 做爲通道讀寫的數據緩衝區,charBuffer 用於存儲解碼後的字符。clear() 和 flip() 的用法正如上文所述,須要注意的是最後那個 compact() 方法,即便 charBuffer 的大小徹底足以容納 byteBuffer 解碼後的數據,這個 compact() 也必不可少,這是由於經常使用中文字符的UTF-8編碼佔3個字節,所以有很大機率出如今中間截斷的狀況,請看下圖:

當 Decoder 讀取到緩衝區末尾的 0xe4 時,沒法將其映射到一個 Unicode,decode()方法第三個參數 false 的做用就是讓 Decoder 把沒法映射的字節及其後面的數據都視做附加數據,所以 decode() 方法會在此處中止,而且 position 會回退到 0xe4 的位置。如此一來, 緩衝區中就遺留了「中」字編碼的第一個字節,必須將其 compact 到前面,以正確的和後序數據拼接起來。

BTW,例子中的 CharsetDecoder 也是 Java NIO 的一個新特性,因此你們應該發現了一點哈,NIO的操做是面向緩衝區的(傳統I/O是面向流的)。

至此,咱們瞭解了 Channel 與 Buffer 的基本用法。接下來要說的是讓一個線程管理多個Channel的重要組件。

3.Selector

Selector 是什麼

Selector(選擇器)是一個特殊的組件,用於採集各個通道的狀態(或者說事件)。咱們先將通道註冊到選擇器,並設置好關心的事件,而後就能夠經過調用select()方法,靜靜地等待事件發生。

通道有以下4個事件可供咱們監聽:

  • Accept:有能夠接受的鏈接
  • Connect:鏈接成功
  • Read:有數據可讀
  • Write:能夠寫入數據了

爲何要用Selector

前文說了,若是用阻塞I/O,須要多線程(浪費內存),若是用非阻塞I/O,須要不斷重試(耗費CPU)。Selector的出現解決了這尷尬的問題,非阻塞模式下,經過Selector,咱們的線程只爲已就緒的通道工做,不用盲目的重試了。好比,當全部通道都沒有數據到達時,也就沒有Read事件發生,咱們的線程會在select()方法處被掛起,從而讓出了CPU資源。

使用方法

以下所示,建立一個Selector,並註冊一個Channel。

注意:要將 Channel 註冊到 Selector,首先須要將 Channel 設置爲非阻塞模式,不然會拋異常。

Selector selector = Selector.open();
channel.configureBlocking(false);
SelectionKey key = channel.register(selector, SelectionKey.OP_READ);
複製代碼

register()方法的第二個參數名叫「interest set」,也就是你所關心的事件集合。若是你關心多個事件,用一個「按位或運算符」分隔,好比

SelectionKey.OP_READ | SelectionKey.OP_WRITE
複製代碼

這種寫法一點都不陌生,支持位運算的編程語言裏都這麼玩,用一個整型變量能夠標識多種狀態,它是怎麼作到的呢,其實很簡單,舉個例子,首先預約義一些常量,它們的值(二進制)以下

能夠發現,它們值爲1的位都是錯開的,所以對它們進行按位或運算以後得出的值就沒有二義性,能夠反推出是由哪些變量運算而來。怎麼判斷呢,沒錯,就是「按位與」運算。好比,如今有一個狀態集合變量值爲 0011,咱們只須要判斷 "0011 & OP_READ" 的值是 1 仍是 0 就能肯定集合是否包含 OP_READ 狀態。

而後,注意 register() 方法返回了一個SelectionKey的對象,這個對象包含了本次註冊的信息,咱們也能夠經過它修改註冊信息。從下面完整的例子中能夠看到,select()以後,咱們也是經過獲取一個 SelectionKey 的集合來獲取到那些狀態就緒了的通道。

一個完整實例

概念和理論的東西闡述完了(其實寫到這裏,我發現沒寫出多少東西,好尷尬(⊙ˍ⊙)),看一個完整的例子吧。

這個例子使用Java NIO實現了一個單線程的服務端,功能很簡單,監聽客戶端鏈接,當鏈接創建後,讀取客戶端的消息,並向客戶端響應一條消息。

須要注意的是,我用字符 '\0'(一個值爲0的字節) 來標識消息結束。

單線程Server

public class NioServer {
    
    public static void main(String[] args) throws IOException {
        // 建立一個selector
        Selector selector = Selector.open();
        
        // 初始化TCP鏈接監聽通道
        ServerSocketChannel listenChannel = ServerSocketChannel.open();
        listenChannel.bind(new InetSocketAddress(9999));
        listenChannel.configureBlocking(false);
        // 註冊到selector(監聽其ACCEPT事件)
        listenChannel.register(selector, SelectionKey.OP_ACCEPT);
        
        // 建立一個緩衝區
        ByteBuffer buffer = ByteBuffer.allocate(100);
        
        while (true) {
            selector.select(); //阻塞,直到有監聽的事件發生
            Iterator<SelectionKey> keyIter = selector.selectedKeys().iterator();
            
            // 經過迭代器依次訪問select出來的Channel事件
            while (keyIter.hasNext()) {
                SelectionKey key = keyIter.next();
                
                if (key.isAcceptable()) { // 有鏈接能夠接受
                    SocketChannel channel = ((ServerSocketChannel) key.channel()).accept();
                    channel.configureBlocking(false);
                    channel.register(selector, SelectionKey.OP_READ);
                    
                    System.out.println("與【" + channel.getRemoteAddress() + "】創建了鏈接!");
                    
                } else if (key.isReadable()) { // 有數據能夠讀取
                    buffer.clear();
    
                    // 讀取到流末尾說明TCP鏈接已斷開,
                    // 所以須要關閉通道或者取消監聽READ事件
                    // 不然會無限循環
                    if (((SocketChannel) key.channel()).read(buffer) == -1) {
                        key.channel().close();
                        continue;
                    } 
                    
                    // 按字節遍歷數據
                    buffer.flip();
                    while (buffer.hasRemaining()) {
                        byte b = buffer.get();
                        
                        if (b == 0) { // 客戶端消息末尾的\0
                            System.out.println();
                            
                            // 響應客戶端
                            buffer.clear();
                            buffer.put("Hello, Client!\0".getBytes());
                            buffer.flip();
                            while (buffer.hasRemaining()) {
                                ((SocketChannel) key.channel()).write(buffer);
                            }
                        } else {
                            System.out.print((char) b);
                        }
                    }
                }
                
                // 已經處理的事件必定要手動移除
                keyIter.remove();
            }
        }
    }
}
複製代碼

Client

這個客戶端純粹測試用,爲了看起來不那麼費勁,就用傳統的寫法了,代碼很簡短。

要嚴謹一點測試的話,應該併發運行大量Client,統計服務端的響應時間,並且鏈接創建後不要馬上發送數據,這樣才能發揮出服務端非阻塞I/O的優點。

public class Client {
    
    public static void main(String[] args) throws Exception {
        Socket socket = new Socket("localhost", 9999);
        InputStream is = socket.getInputStream();
        OutputStream os = socket.getOutputStream();
 
        // 先向服務端發送數據
        os.write("Hello, Server!\0".getBytes());
        
        // 讀取服務端發來的數據
        int b;
        while ((b = is.read()) != 0) {
            System.out.print((char) b);
        }
        System.out.println();
        
        socket.close();
    }
}
複製代碼

NIO vs IO

學習了NIO以後咱們都會有這樣一個疑問:到底何時該用NIO,何時該用傳統的I/O呢?

其實瞭解他們的特性後,答案仍是比較明確的,NIO擅長1個線程管理多條鏈接,節約系統資源,可是若是每條鏈接要傳輸的數據量很大的話,由於是同步I/O,會致使總體的響應速度很慢;而傳統I/O爲每一條鏈接建立一個線程,能充分利用處理器並行處理的能力,可是若是鏈接數量太多,內存資源會很緊張。加羣895244712,免費獲取Java架構師進階學習資料

總結就是:鏈接數多數據量小用NIO,鏈接數少用I/O(寫起來也簡單- -)。

Next

通過NIO核心組件的學習,瞭解了非阻塞服務端實現的基本方法。然而,細心的大家確定也發現了,上面那個完整的例子,實際上就隱藏了不少問題。好比,例子中只是簡單的將讀取到的每一個字節輸出,實際環境中確定是要讀取到完整的消息後才能進行下一步處理,因爲NIO的非阻塞特性,一次可能只讀取到消息的一部分,這已經很糟糕了,若是同一條鏈接會連續發來多條消息,那不只要對消息進行拼接,還須要切割,同理,例子中給客戶端響應的時候,用了個while()循環,保證數據所有write完成再作其它工做,實際應用中爲了性能,確定不會這麼寫。另外,爲了充分利用現代處理器多核心並行處理的能力,應該用一個線程組來管理這些鏈接的事件。

要解決這些問題,須要一個嚴謹而繁瑣的設計,不過幸運的是,咱們有開源的框架可用,那就是優雅而強大的Netty,Netty基於Java NIO,提供異步調用接口,開發高性能服務器的一個很好的選擇,以前在項目中使用過,但沒有深刻學習,打算下一步好好學學它,到時候再寫一篇筆記。

Java NIO設計的目標是爲程序員提供API以享受現代操做系統最新的I/O機制,因此覆蓋面較廣,除了文中所涉及的組件與特性,還有不少其它的,好比 Pipe(管道)、Path(路徑)、Files(文件) 等,有的是用於提高I/O性能的新組件,有的是簡化I/O操做的工具,具體用法能夠參看最後 References 裏的連接。

References

[1] Differences Between Synchronous and Asynchronous I/O

[2] Java NIO - Wikipedia

[3] Java NIO Tutorial

[4] Package java.nio

相關文章
相關標籤/搜索