小師妹學JavaIO之:NIO中那些奇怪的Buffer

簡介

妖魔鬼怪快快顯形,今天F師兄幫助小師妹來斬妖除魔啦,什麼BufferB,BufferL,BufferRB,BufferRL,BufferS,BufferU,BufferRS,BufferRU通通給你剖析個清清楚楚明明白白。java

Buffer的分類

小師妹:F師兄不都說JDK源碼是最好的java老師嗎?爲程不識源碼,就稱牛人也枉然。可是我最近在學習NIO的時候居然發現有些Buffer類竟然沒有註釋,就那麼突兀的寫在哪裏,讓人好生心煩。程序員

更多內容請訪問 www.flydean.com

竟然還有這樣的事情?快帶F師兄去看看。spring

小師妹:F師兄你看,以ShortBuffer爲例,它的子類怎麼後面都帶一些奇奇怪怪的字符:架構

什麼什麼BufferB,BufferL,BufferRB,BufferRL,BufferS,BufferU,BufferRS,BufferRU都來了,點進去看他們的源碼也沒有說明這些類究竟是作什麼的。spring-boot

還真有這種事情,給我一個小時,讓我仔細研究研究。oop

一個小時後,小師妹,通過我一個小時的辛苦勘察,結果發現,確實沒有官方文檔介紹這幾個類究竟是什麼含義,可是師兄我掐指一算,好像發現了這些類之間的小祕密,且聽爲兄娓娓道來。學習

以前的文章,咱們講到Buffer根據類型能夠分爲ShortBuffer,LongBuffer,DoubleBuffer等等。區塊鏈

可是根據本質和使用習慣,咱們又能夠分爲三類,分別是:ByteBufferAsXXXBuffer,DirectXXXBuffer和HeapXXXBuffer。this

ByteBufferAsXXXBuffer主要將ByteBuffer轉換成爲特定類型的Buffer,好比CharBuffer,IntBuffer等等。spa

而DirectXXXBuffer則是和虛擬內存映射打交道的Buffer。

最後HeapXXXBuffer是在堆空間上面建立的Buffer。

Big Endian 和 Little Endian

小師妹,F師兄,你剛剛講的都不重要,我就想知道類後面的B,L,R,S,U是作什麼的。

好吧,在給你講解這些內容以前,師兄我給你講一個故事。

話說在明末浙江才女吳絳雪寫過一首詩:《春 景 詩》

鶯啼岸柳弄春晴,
柳弄春晴夜月明。
明月夜晴春弄柳,
晴春弄柳岸啼鶯。

小師妹,可有看出什麼特異之處?最好是多讀幾遍,讀出聲來。

小師妹:哇,F師兄,這首詩從頭至尾和從尾到頭讀起來是同樣的呀,又對稱又有意境!

不錯,這就是中文的魅力啦,根據讀的方式不一樣,得出的結果也不一樣,其實在計算機世界也存在這樣的問題。

咱們知道在java中底層的最小存儲單元是Byte,一個Byte是8bits,用16進製表示就是Ox00-OxFF。

java中除了byte,boolean是佔一個字節之外,好像其餘的類型都會佔用多個字節。

若是以int來舉例,int佔用4個字節,其範圍是從Ox00000000-OxFFFFFFFF,假如咱們有一個int=Ox12345678,存到內存地址裏面就有這樣兩種方式。

第一種Big Endian將高位的字節存儲在起始地址

第二種Little Endian將地位的字節存儲在起始地址

其實Big Endian更加符合人類的讀寫習慣,而Little Endian更加符合機器的讀寫習慣。

目前主流的兩大CPU陣營中,PowerPC系列採用big endian方式存儲數據,而x86系列則採用little endian方式存儲數據。

若是不一樣的CPU架構直接進行通訊,就由可能由於讀取順序的不一樣而產生問題。

java的設計初衷就是一次編寫到處運行,因此天然也作了設計。

因此BufferB表示的是Big Endian的buffer,BufferL表示的是Little endian的Buffer。

而BufferRB,BufferRL表示的是兩種只讀Buffer。

aligned內存對齊

小師妹:F師兄,那這幾個又是作什麼用的呢? BufferS,BufferU,BufferRS,BufferRU。

在講解這幾個類以前,咱們先要回顧一下JVM中對象的存儲方式。

還記得咱們是怎麼使用JOL來分析JVM的信息的嗎?代碼很是很是簡單:

log.info("{}", VM.current().details());

輸出結果:

# Running 64-bit HotSpot VM.
# Using compressed oop with 3-bit shift.
# Using compressed klass with 3-bit shift.
# WARNING | Compressed references base/shifts are guessed by the experiment!
# WARNING | Therefore, computed addresses are just guesses, and ARE NOT RELIABLE.
# WARNING | Make sure to attach Serviceability Agent to get the reliable addresses.
# Objects are 8 bytes aligned.
# Field sizes by type: 4, 1, 1, 2, 2, 4, 4, 8, 8 [bytes]
# Array element sizes: 4, 1, 1, 2, 2, 4, 4, 8, 8 [bytes]

上面的輸出中,咱們能夠看到:Objects are 8 bytes aligned,這意味着全部的對象分配的字節都是8的整數倍。

再注意上面輸出的一個關鍵字aligned,確認過眼神,是對的那我的。

aligned對齊的意思,表示JVM中的對象都是以8字節對齊的,若是對象自己佔用的空間不足8字節或者不是8字節的倍數,則補齊。

仍是用JOL來分析String對象:

[main] INFO com.flydean.JolUsage - java.lang.String object internals:
 OFFSET  SIZE      TYPE DESCRIPTION                               VALUE
      0    12           (object header)                           N/A
     12     4    byte[] String.value                              N/A
     16     4       int String.hash                               N/A
     20     1      byte String.coder                              N/A
     21     1   boolean String.hashIsZero                         N/A
     22     2           (loss due to the next object alignment)
Instance size: 24 bytes
Space losses: 0 bytes internal + 2 bytes external = 2 bytes total

能夠看到一個String對象佔用24字節,可是真正有意義的是22字節,有兩個2字節是補齊用的。

對齊的好處顯而易見,就是CPU在讀取數據的時候更加方便和快捷,由於CPU設定是一次讀取多少字節來的,若是你存儲是沒有對齊的,則CPU讀取起來效率會比較低。

如今能夠回答部分問題:BufferU表示是unaligned,BufferRU表示是隻讀的unaligned。

小師妹:那BufferS和BufferRS呢?

這個問題其實仍是很難回答的,可是通過師兄個人不斷研究和探索,終於找到了答案:

先看下DirectShortBufferRU和DirectShortBufferRS的區別,二者的區別在兩個地方,先看第一個Order:

DirectShortBufferRU:

public ByteOrder order() {
        return ((ByteOrder.nativeOrder() != ByteOrder.BIG_ENDIAN)
                ? ByteOrder.LITTLE_ENDIAN : ByteOrder.BIG_ENDIAN);
    }
DirectShortBufferRS:

public ByteOrder order() {
        return ((ByteOrder.nativeOrder() == ByteOrder.BIG_ENDIAN)
                ? ByteOrder.LITTLE_ENDIAN : ByteOrder.BIG_ENDIAN);
    }

能夠看到DirectShortBufferRU的Order是跟nativeOrder是一致的。而DirectShortBufferRS的Order跟nativeOrder是相反的。

爲何相反?再看二者get方法的不一樣:

DirectShortBufferU:

public short get() {
        try {
            checkSegment();
            return ((UNSAFE.getShort(ix(nextGetIndex()))));
        } finally {
            Reference.reachabilityFence(this);
        }
    }
DirectShortBufferS:

public short get() {
        try {
            checkSegment();
            return (Bits.swap(UNSAFE.getShort(ix(nextGetIndex()))));
        } finally {
            Reference.reachabilityFence(this);
        }
    }

區別出來了,DirectShortBufferS在返回的時候作了一個bits的swap操做。

因此BufferS表示的是swap事後的Buffer,和BufferRS表示的是隻讀的swap事後的Buffer。

總結

不寫註釋實在是害死人啊!尤爲是JDK本身也不寫註釋的狀況下!

更多精彩內容且看:

本文做者:flydean程序那些事

本文連接:http://www.flydean.com/java-io-nio-kinds-of-buffer/

本文來源:flydean的博客

歡迎關注個人公衆號:程序那些事,更多精彩等着您!

相關文章
相關標籤/搜索