HBase2.0中的Benchmark工具 — PerformanceEvaluation

時間 2019-11-16

標籤 hbase2.0 hbase benchmark 工具 performanceevaluation 欄目 Hadoop 简体版

原文原文鏈接

摘要：在項目開發過程當中，咱們常常須要一些benchmark工具來對系統進行壓測，以得到系統的性能參數，極限吞吐等等指標。而在HBase中，就自帶了一個benchmark工具—PerformanceEvaluation，能夠很是方便地對HBase的Put、Get、Scan等API進行性能測試，並提供了很是豐富的參數來模擬各類場景。java

簡介
在項目開發過程當中，咱們常常須要一些benchmark工具來對系統進行壓測，以得到系統的性能參數，極限吞吐等等指標。而在HBase中，就自帶了一個benchmark工具—PerformanceEvaluation，能夠很是方便地對HBase的Put、Get、Scan等API進行性能測試，並提供了很是豐富的參數來模擬各類場景。這篇文章，就以HBbase2.0中的PerformanceEvaluation工具爲例，給你們講解一下這款HBase benchmark工具的使用和注意事項算法

參數介紹
PerformanceEvaluation的全名是org.apache.hadoop.hbase.PerformanceEvaluation. 已經集成在了bin/hbase工具集中。在安裝好HBase的機器上，在HBase的安裝路徑的bin目錄下執行hbase pe，加上相應參數，便可運行PE工具（如下簡稱PerformanceEvaluation爲PE）。若是不加任何參數，則會輸出PE的幫助信息。apache

[root@xxxxxx ~]# hbase pe
Usage: java org.apache.hadoop.hbase.PerformanceEvaluation \
  <OPTIONS> [-D<property=value>]* <command> <nclients>

General Options:
 nomapred        Run multiple clients using threads (rather than use mapreduce)
 oneCon          all the threads share the same connection. Default: False
 sampleRate      Execute test on a sample of total rows. Only supported by randomRead. Default: 1.0
 period          Report every 'period' rows: Default: opts.perClientRunRows / 10 = 104857
 cycles          How many times to cycle the test. Defaults: 1.
 traceRate       Enable HTrace spans. Initiate tracing every N rows. Default: 0
 latency         Set to report operation latencies. Default: False
 measureAfter    Start to measure the latency once 'measureAfter' rows have been treated. Default: 0
 valueSize       Pass value size to use: Default: 1000
 valueRandom     Set if we should vary value size between 0 and 'valueSize'; set on read for stats on size: Default: Not set.
 blockEncoding   Block encoding to use. Value should be one of [NONE, PREFIX, DIFF, FAST_DIFF, ROW_INDEX_V1]. Default: NONE
...(後面還有很長)

PE工具的參數很是多，不少參數只是用於某項專門的測試。這裏我只介紹一下比較重要的幾個全局參數。數組

nomapred 採用MapReduce的方式啓動多線程測試仍是經過多線程的方式，若是沒有安裝MapReduce，或者不想用MapReduce，一般咱們採用多線程的方式，所以通常在命令中加上--nomapred來表示不使用MapReduce。
oneCon 多線程運行測試時，底層使用一個仍是多個參數。這個參數默認值爲false，每一個thread都會啓一個Connection，建議把這個參數設爲True，至於緣由，後面的章節會講。
valueSize 寫入HBase的value的size，單位是Byte，你們能夠根據本身實際的場景設置這個Value的大小。
blockEncoding PE工具會自動建表，這個參數用來指定表的block encoding。關於encoding後面會有專門的文章介紹，這裏再也不講。
table 測試表的名字，若是不設，默認爲TestTable。
rows 總共測試的行數。注意這裏的行數是指單線程的行數，若是rows=100，線程數爲10，那麼在寫測試中，寫入HBase的將是 100 x 10 行。
size 總測試的數據大小，單位爲GB，這個參數與上面的size是互斥的，不要兩個參數一塊兒設。在使用randomReads和randomSeekScans測試時，這個size能夠用來指定讀取的數據範圍。這個值在Read時很是重要，若是設的很差，會產生不少返回值爲空的讀，影響測試結果，下面會詳細介紹。
compress 設置表的compress算法，根據本身選擇，默認是None,即不作壓縮。
presplit 表的預分裂region個數，在作性能測試時必定要設置region個數，否則全部的讀寫會落在一個region上，嚴重影響性能
autoFlush 默認爲false，即PE默認用的是BufferedMutator，BufferedMutator會把數據攢在內存裏，達到必定的大小再向服務器發送，若是想明確測單行Put的寫入性能，建議設置爲true。我的以爲PE中引入autoFlush會影響統計的準確性，由於在沒有攢夠足夠的數據時，put操做會立馬返回，根本沒產生RPC，可是相應的時間和次數也會被統計在最終結果裏。
比較重要的參數就這麼多，其餘的參數要麼使用默認就好，要麼就是和具體的測試命令相關，用戶能夠根據測試的內容具體設置。安全

使用示例
下面我用測試讀和寫兩個示例來說解下PE工具的使用服務器

隨機寫測試 RandomWriteTest
RandomWriteTest經常使用來評估HBase的寫性能。使用的命令以下：多線程

hbase pe --nomapred --oneCon=true --valueSize=100 --compress=SNAPPY --rows=150000 --autoFlush=true --presplit=64 randomWrite 64

在這個測試中，我把PE模式設爲了非MapReduuce(--nomapred)，即採用起線程的形式。跑的命令是randomWrite，即隨機寫入、後面跟的64表明起了64個線程來作寫入。--rows=150000 表明每一個線程會寫入150000行數據。其餘的參數含義能夠參見以前的章節。PE工具的全部的輸出都會直接寫到LOG文件，LOG的位置須要參照HBase的設置。運行結束後，PE會分別打出每一個線程的延遲情況。以下面是其中一個線程的結果：運維

2018-05-18 12:07:23,282 INFO  [TestClient-11] hbase.PerformanceEvaluation(475): Latency (us) : mean=2516.36, min=872.00, max=73776.00, stdDev=1978.60, 50th=2304.00, 75th=2605.00, 95th=3418.00, 99th=790
8.00, 99.9th=34241.00, 99.99th=73263.00, 99.999th=73776.00
2018-05-18 12:07:23,282 INFO  [TestClient-11] hbase.PerformanceEvaluation(475): Num measures (latency) : 150000
2018-05-18 12:07:23,283 INFO  [TestClient-11] hbase.PerformanceEvaluation(475): Mean      = 2516.36
Min       = 872.00
Max       = 73776.00
StdDev    = 1978.60
50th      = 2304.00
75th      = 2605.00
95th      = 3418.00
99th      = 7908.00
99.9th    = 34241.00
99.99th   = 73263.00
99.999th  = 73776.00

PE統計了這個線程一共跑了多少行，和相應的延遲統計，包括min，max，999th延遲等等。
並在最後統計了全部線程的最大持續時間，平均持續時間等等。dom

2018-05-18 12:07:25,564 INFO  [main] hbase.PerformanceEvaluation(507): [RandomWriteTest duration ]      Min: 36969ms    Max: 40160ms    Avg: 38203ms

比較坑的是，PE居然不會統計全部線程的平均延遲和總的吞吐。。。工具

隨機讀測試 RandomReadTest
在進行RandomReadTest以前，須要準備數據。準備數據建議使用SequentialWriteTest。以下面的語句

hbase pe --nomapred --oneCon=true --valueSize=100 --compress=SNAPPY --size=2 --presplit=64 sequentialWrite 64

爲啥要用SequentialWriteTest？

這是由於PE寫入的行是有規律的。若是傳入的是--row=1000，thread數是10，則寫入的行總數是1000 x 10 = 10000。在SequentialWrite中，PE會給每一個線程設置偏移量，保證0~9999這10000個行（會把全部數字擴展成26位等長的byte數組）一行不差地寫入HBase。若是是RandomWriteTest，在每一個線程中會隨機生成一個0~9999以前的數字寫入（--row=1000表明每一個線程會寫1000次）。因爲是隨機，會形成中間有些行沒有寫入，那麼在讀取測試時，讀到的就是空行，影響測試結果。

爲啥要用--size而不是--row？

--size=2，表明寫入2GB數據，具體是多少行PE內部會本身去算。假設我這裏填的是--row=1000，線程數是10，那麼寫入的數據範圍是0~9999。當我在作RandomReadTest時，若是須要修改線程數，好比我想測20個線程並行讀，那麼數據讀取的範圍將是0~ （1000 * 20 - 1），很大一部分讀是空讀！你固然能夠根據線程數來調整讀測試時row變量的值，使讀的總體範圍不超過寫入的數據範圍，可是row的大小影響了總體測試的時間，而統一用size你就啥都不用管了。

RandomReadTest的命令以下：

hbase pe --nomapred --oneCon=true --valueSize=100 --size=2 randomRead 100
注意在讀測試時不要加表的任何參數，如presplit這些，若是加了會使PE從新建表，以前寫入的數據就拜拜了。valueSize和size的值要與準備數據命令中保持一致，PE靠這兩個值來算數據的範圍和行數。Read測試的輸出與Write測試的輸出相似。

PE工具存在的問題
PE工具雖然功能已經比較完備，可是使用下來發現仍是存在必定的問題的，主要有如下幾點：

Connection的數目設置只能由oneCon這個參數指定，要麼就是一個connection，要麼就是每一個thread一個connection。當測試的線程數比較多時，就比較尷尬了，若是隻用一個connection，connection內部的metaCache等實現都是有鎖的，在拿metacache時，線程較多會產生爭搶，影響對服務器性能的評估。若是每一個thread一個connection更加不可取，每一個connection中都會有一個netty的客戶端，若是我沒記錯的話，每一個客戶端中將會有 2*CPU個worker threads。這在PE運行過程當中產生大量的context switch，更加影響性能測試。根據個人測試發現，在開100個thread測試時，若是每一個thread開一個connection，測試結果比只用一個connection的要慢10%。Context switch的頻率更是10倍以上。
沒有multiPut的支持，PE寫時使用的BufferedMutator須要靠調整size來決定buffer多少個put再上發。若是我想明確測試batch 5個put請求，batch10個put請求，都比較難實現。
沒有統計整體的RT和TPS/QPS,只有按單個thread統計，若是我用100個thread去壓服務器，這要我怎麼去評估服務器的吞吐……
針對以上的問題，我對PerformanceEvaluation工具作了一些改進，回饋給了社區，具體你們能夠看HBASE-20601這個issue。主要的改進有：

加入multiPut參數，支持設置batch的數量
加入connCount參數，支持設置connection的多少，好比connCount=2，無論多少個thread都會共用這2個connection
支持統計全部線程的平均TPS，平均延遲
一些代碼的優化和去重
你們在PE工具的使用過程當中還遇到了什麼問題，或者有什麼不懂的地方，歡迎與我聯繫。

雲端使用
阿里HBase目前已經在阿里雲提供商業化服務，任何有需求的用戶均可以在阿里雲端使用深刻改進的、一站式的HBase服務。雲HBase版本與自建HBase相比在運維、可靠性、性能、穩定性、安全、成本等方面均有不少的改進，
原文連接

相關標籤/搜索

hbase2.0

performanceevaluation

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。