[netty4][netty-common]FastThreadLocal及其相關類系列以及CPU cacheline padding補齊優化的相關知識

時間 2019-11-09

標籤 netty4 netty common fastthreadlocal 及其相關系列以及 cpu cacheline padding 補齊優化知識欄目 Netty 简体版

原文原文鏈接

FastThreadLocal

概述： ThreadLocal的一個特定變種改善，有更好的存取性能。
內部採用一個數組來代替ThreadLocal內部的hash表來存放變量。雖然這看起來是微不足道的，可是他確實比hash表性能好那麼一點，在頻繁存取時會更明顯。若是用DefaultThreadFactory建立線程，那麼默認建立出來的就是FastThreadLocalThread，就會用FastThreadLocal。javascript

set數據靠InternalThreadLocalMap維護，InternalThreadLocalMap內部靠一個數組(就是上面說的)維護變量數據。html

擴展了什麼:
按ThreadLocal API的約定行爲，依賴InternalThreadLocalMap實現了這些行爲，諸如get、set、remove等。
remove支持onRemoval回調。java

InternalThreadLocalMap

自身實例獲取

get方法是對外暴露去自身實例的，有兩種方式取到InternalThreadLocalMap實例：git

若是當前線程是FastThreadLocalThreadInternal，直接取其實例變量ThreadLocalMap，內部稱之爲fastGet。
若是是JDK的Thread，那麼靠JDK的TheadLocal取到ThreadLocalMap，內部稱之爲slowGet。

數據存取

真正的存取變量是靠indexedVariable和setIndexedVariable方法完成。
閱讀代碼不難發現，是靠Object[] indexedVariables這個數組達成數據存儲的目的。github

存放數據的數組擴容

indexedVariables數組靠expandIndexedVariableTableAndSet動態擴容。初始長度是32。
擴容算法有點意思，是比當前index小的最大的2的n次方的值擴一倍，好比當前index是132，那麼就會擴成256長度的數組。ajax

Object[] oldArray = indexedVariables;
final int oldCapacity = oldArray.length;
int newCapacity = index;
newCapacity |= newCapacity >>>  1;
newCapacity |= newCapacity >>>  2;
newCapacity |= newCapacity >>>  4;
newCapacity |= newCapacity >>>  8;
newCapacity |= newCapacity >>> 16;
newCapacity ++;

是否徹底用數組存放數據？

不徹底是。由於InternalThreadLocalMap的父類UnpaddedInternalThreadLocalMap自帶了一些經常使用的字段：算法

futureListenerStackDepth
localChannelReaderStackDepth
handlerSharableCache
counterHashCode
random
typeParameterMatcherGetCache
typeParameterMatcherFindCache
stringBuilder
charsetEncoderCache
charsetDecoderCache
arrayList
這個11個是靠實例字段直接存儲。
另外此類，還用了padding補齊的手段優化了CPU cacheline僞共享的問題。我猜想性能提高主要來源於此。

// Cache line padding (must be public)
// With CompressedOops enabled, an instance of this class should occupy at least 128 bytes.
public long rp1, rp2, rp3, rp4, rp5, rp6, rp7, rp8, rp9;

關於padding補齊

該類爲了解決cache line僞共享的問題，採用了padding補齊。
該類(4.1.32.Final版本)補齊後經過sizeOfObject(也能夠用jol)算出來大小是136。 jol針對idea是有插件的，不像JDK帶的jol要運行起來才能計算對象大小。idea那個插件是針對語法樹分析後算的，由於就算你的類有編譯錯誤，他也能算出來。使用時注意選擇相應的壓縮模式，右上角。
關於jol有官方的sample是很不錯的，還有個博客寫的還行，包括字段重排等都有。json

爲何是136？按說128就行啊？這個事情我以前也思索了很久沒有答案。直至翦哥今天跟我提到了一個別人前幾天提的issue，才翻到原來有人和咱們有同樣的困惑，並且答案居然是在netty版本迭代過程當中InternalThreadLocalMap的父類加了個字段：ArrayList數組