解密雲HBase時序引擎OpenTSDB 優化技術

時間 2019-12-26

標籤解密 hbase 時序引擎 opentsdb 優化技術欄目 Hadoop 简体版

原文原文鏈接

逝者如斯夫，不捨晝夜。 —— 孔子

時間如流水，一去不復返。自古不乏對時間流逝的感慨，而現代已經有不少技術記錄流逝的過去。咱們能夠拍照，能夠錄像，固然還能夠用時序數據庫！數據庫

時序數據庫是專門存放隨着時間推移而不斷變化的數據。近些年，隨着IoT等概念的流行，時序數據庫成爲數據庫一個相對獨立的領域逐漸受到重視，普遍應用於物聯網、監控系統、金融、醫療和零售等多種場景。併發

那麼雲上的用戶如何構建一個存儲海量數據的時序數據庫呢？筆者這裏推薦使用 雲HBase + OpenTSDB 方案。雲HBase是使用阿里多年優化過的HBase內核版本，本文不做過多介紹，詳情請看產品主頁。測試

OpenTSDB簡介

OpenTSDB是一款基於HBase構建的時序數據庫，它的數據存儲徹底交給HBase，自己沒有任何數據存儲。全部節點是對等的，因此部署起來實際上是很是方便的。由於基於HBase，因此自己就具有了橫向擴展，存儲海量數據的能力。常見的部署模式有2種，一種分離部署，一種混合部署。優化

獨立部署，即與多個業務共享一個HBase。適合時序業務較小，或者用不滿HBase資源。ui

混合部署，即TSDB進程和RS在一個VM內。適合時序業務較重，須要獨享HBase。spa

上述2種模式，雲HBase產品都能提供支持，雲HBase購買頁面現已增長時序引擎購買入口。設計

OpenTSDB數據定義

一條時間線由 Metirc + 多個tag 惟一肯定，時間線上會有源源不斷的數據點(Data Point)寫入，數據點由時間戳和值組成。OpenTSDB支持秒級(10位整數)，毫秒級別（13位整數）兩種時間精度。3d

舉個例子，好比咱們監控一個手環收集的心跳信息，那麼咱們能夠這樣定義：code

Metric: "band.heartbeat"
Tags: "id"               # 只定義一個tag，就是手環的ID

那麼咱們經過 band.heartbeat + id=1 就能查詢到編爲1的手環收集到的心跳信息。blog

OpenTSDB數據存儲格式

數據表總體設計

這個設計有幾個特色：

1.metric和tag映射成UID，不存儲實際字符串，以節約空間。
2.每條時間線每小時的數據點歸在一行，每列是一個數據點，這樣每列只須要記錄與這行起始時間偏移，以節省空間。
3.每列就是一個KeyValue，若是是毫秒精度，一行最多能夠有3600000個KV，這裏其實會有些問題，後面會講到。

RowKey格式

salt：打散同一metric不一樣時間線的熱點
metric, tagK, tagV：實際存儲的是字符串對應的UID（在tsdb-uid表中）
timestamp：每小時數據存在一行，記錄的是每小時整點秒級時間戳

metric和tag

它們長度默認是3個字節，即最多隻能分配 2^24=16777216 個UID。能夠經過這些參數調整：

tsd.storage.uid.width.metric # metric UID長度，默認3
tsd.storage.uid.width.tagk   # tagK UID長度，默認3
tsd.storage.uid.width.tagv   # tagV UID長度 默認3
# 這3者的UID分配分別是獨立的空間

注意：
集羣已經寫過數據後就沒法修改，因此最好是一開始就肯定好，建議4個字節。由於使用壓縮技術後，RowKey多佔的幾個字節能夠忽略，下文會提到。

salt

salt這個東西最好根據本身HBase集羣規模去配置，它有2個配置：

tsd.storage.salt.width   # 默認1，1基本夠了，不用調整
tsd.storage.salt.buckets # 打散到幾個bucket去，默認20

查詢的時候會併發 tsd.storage.salt.buckets 個Scanner到HBase上，因此若是這個配置太大，對查詢影響比較大，容易打爆HBase。這裏實際上是一個權衡，寫入熱點和查詢壓力。默認20其實我我的以爲有點多，配置3～8就差很少了，固然實際效果還和metric設計有關，若是在一個metric裏設計了不少時間線，那就得配置不少bucket。在一個metric中設計過多時間線，會影響OpenTSDB的查詢效率，因此不建議這麼作。
這個參數也是設置了就不能改的，因此也是要一開始規劃好。