jimdb壓測踩坑記

時間 2019-11-05

標籤 jimdb 简体版

原文原文鏈接

本文記錄在jimdb壓測過程當中遇到的各類小坑，望可以拋磚引玉。 redis

1.壓測流量起來後，過了5分鐘左右，發現ops突降，大概降了三分之一，而後穩定了下來 docker

大概緣由：此種狀況，jimdb極有可能某個分片的鏈接數打滿，從而致使分片的cpu達到100%。緩存

調優方案：首先，默認分片鏈接數爲1w，此時能夠根據本身的需求，若是本身的docker數量不多，能夠調整成2w，反之則3w。 session

而後，看程序中的操做，是否是有pipeline或者mget等操做，若是有，且程序日誌中輸出了大量的can't get jedis connection from jedis pool，則調整以下線程池，直至找到比較合適的值：併發

若是程序中普通的redis命令操做比較多，則能夠調整以下參數，注意maxIdelPerKey不要超過64，不然無效，MaxTotalPerKey太大會形成鏈接數過多，太少會形成頻繁鏈接，須要根據具體壓測狀況設置合適的值：運維

另外，鏈接的超時時間等不可設置過長，建議設置以下：異步

上面參數的調整，須要壓測十幾回甚至幾十次，才能慢慢的調整出jimdb合理的參數值，合理的表現就是： jvm

好比說第一波壓測，jimdb參數優化前，慢慢起量，併發到5000的時候，jimdb由於某個分片鏈接數和cpu太高，掛了。那麼參數的調優，就能夠以5000併發爲基礎慢慢調整，直至調整出5000併發不會將jimdb分片打掛的狀況。則視爲當前jimdb調整參數合理。更加理想的狀況就是，jimdb參數調整完畢後，你加500甚至1000併發上去，jimdb還能扛得住，這種狀況，則說明jimdb參數調整很是合理。性能

切忌遇到jimdb分片掛了後，覺得是性能問題，而後更換分片操做，因爲新分片追加上來後，鏈接數都被清理光了，再起壓測，由於壓力反而不會很大，因此反而顯得正常，可是此種狀況下是及其不正常的，極有可能重啓docker集羣后再壓測，依然會掛。優化

一旦jimdb分片打掛後，從新進行下一波壓得的時候，記得將docker集羣的全部機器重啓一下，以便於清理掉鏈接數，不然的話，直接進行壓測，會頻頻的致使分片數掛掉的狀況。

調整參數後，效果不明顯的話，也建議重啓下docker集羣。

若是不想重啓jimdb集羣的話，jimdb中清理集羣命令也能夠達到釋放鏈接數的目的。

2. 壓測流量起來過程當中，有一個點，總體ops爲0

分爲幾種狀況

狀況1，須要檢查程序中是否有jmq生產，而後監控下jmq生產性能，若是壓測過程當中在某個點踩中了jmq生產的tp max點（通常會是2002ms，4002ms左右），會形成當前點ops爲0；

狀況2，須要檢查程序中是否有fullgc產生或者頻繁的younggc（一分鐘超過三四十次），且youggc耗時廣泛超過40ms以上

狀況3，jvm老年代不釋放，好比本地緩存寫成了static，滿了後又沒有過時策略等（參見tomact中session保持）

其餘狀況。。。。。

3. 壓測過程當中，感受沒什麼jimdb瓶頸，加docker後方法ops死活上不去或者上去的一點兒不明顯

若是你程序中有jmq生產，在jmq生產性能這塊，若是數據容許丟失，可讓jmq運維給你換成異步刷盤，同時加一些broker，則ops將會有明顯提高