阿里HBase的數據管道設施實踐與演進

時間 2020-01-18

原文原文鏈接

摘要：第九屆中國數據庫技術大會，阿里巴巴技術專家孟慶義對阿里HBase的數據管道設施實踐與演進進行了講解。主要從數據導入場景、 HBase Bulkload功能、HImporter系統、數據導出場景、HExporter系統這些部分進行了講述。

直播視頻請點擊
 PPT下載請點擊
精彩視頻整理：算法

數據導入場景

生意參謀

生意參謀是一種爲商家服務，幫助商家進行決策和運營的數據產品。如在淘寶或天貓上開一家店，生意參謀會提供店裏天天進入的流量、轉化率、客戶的畫像和同行業進行對比這些數據屬於什麼位置。商家能夠根據流量分析、活動分析和行業分析去進行決策。能夠根據平時日誌、點擊量和訪問量，數據庫把數據經過實時的流處理寫入HBase。有一部分寫到離線系統裏，按期作一些清洗和計算再寫入HBase，而後供業務去查詢 HBase。數據庫

螞蟻風控

在螞蟻上任何一筆交易支付都會調用風控，風控主要是去看此次交易是否屬於同一個設備，是不是常常交易的地點，以及交易的店鋪信息。它必須在100ms—200ms把風險作完，風控是根據長期的歷史信息、近期歷史的信息和實時的信息三個方向作綜合考量。用戶的輸入會實時的寫入HBase，同時這個實時的信息增量也會導入到離線系統裏面，離線系統會按期的對數據進行計算，計算的數據結果會做爲歷史或近期歷史再寫回HBase，一個支付可能會調百十次的風控，並且須要在百毫秒內進行返回。安全

數據導入須要解決的問題

2013年剛剛開始作數據導入的時候面臨的更多的是功能需求性的問題，如今須要考慮的是導入的週期性調度、異構數據源多、導入效率高和多集羣下的數據一致性的問題。前兩個問題更適合由平臺化去解決，HBase的數據導入更關注的是導入效率和多集羣下的數據的一致性。服務器

什麼是Bulkload？Bulkload有什麼功能？

Bulkload使用的是一種新的結構LSM Tree進行寫入更新，其結構如上圖所示。使用Application code 進行數據寫入，數據會被寫入到MemStore，MemStore在HBase裏是一個跳錶，能夠把它當作一個有序的列表，並不斷往裏面插入數據。當數據達到必定量時就會啓動flush對數據進行編碼和壓縮，並寫成HFile。HFile是由索引塊和數據塊組成的文件結構，其特色是隻讀性，生成HFile以後就不可改了。當用戶進行讀取數據的時候，就會從三個HFile和一個MemStore進行查找進行讀取。這個結構的優化就是就把隨機的寫變成了有序的寫。Bulkload就能夠把上千上萬條數據在毫秒內加入到HBase裏。因此Bulkload的優點以下：網絡

高吞吐
不須要WAL
避免small compaction
支持離線構建

Bulkload的導入結構如上圖所示，數據來源於數倉，首先根據HBase的分區規則對數據進行分區和排序。而後會生成Partition Data，須要寫一個HBase插進去。同步中心就會調動一個做業，做業內部會有不少的tasks，每一個task獨立的執行把文件讀出，寫到HDFS上，造成一個HFile文件。當把全部文件寫完，同步中心就會調Bulkload指令到HBase，把全部的HFile一次性的load進去。
之前採用的是多集羣導入的方法，可是多集羣導入有不少缺點以下：架構

很難保證多個任務同時完成，致使必定時間窗口內數據不一致
調度後的運行環境不一致
網絡延遲不一致
失敗重試
集羣部署對業務不透明的缺點：
須要配置多個任務
集羣遷移須要從新配置任務
爲了保證數據的一致性，採用了邏輯集羣導入法。

邏輯集羣的流程如上圖所示，首先進行分區合併，而後進行雙數據流處理，把流分別寫到Active和Backup裏，當Active和Backup的HFile文件寫完後執行Bulkload。由於Bulkload是毫秒級別的，因此能實現一致性。
多任務和邏輯集羣的差異比較以下：框架

多任務模式：須要重複配置，是不透明的，很難保證一致性，分區排序
須要執行兩次，編碼壓縮兩次。
邏輯集羣模式：配置一次，遷移無感知，在一致性上達到毫秒級，分區排序是執行一次，但分區數量變多，編碼壓縮一次。
隨着業務作得愈來愈大，這種導入就會遇到新的線上問題，如擴展性、資源利用率、研發效率、監控等。

什麼是HImporter系統？

HImporter是用於輔助數據同步的中間層，他會把全部HFile的構建，加載邏輯下沉到HImporter層。運維

HImporter所處的位置如上圖所示。分佈式

HImporter的優點

分佈式水平擴展，同一個做業的不一樣任務能夠調度到HImporter的不一樣worker節點
提升資源利用率，將壓縮等CPU密集操做降低到HImporter
快速迭代，HImporter的運維和迭代與同步中心獨立
獨立監控，HImporter可按照本身的需求實現監控

HImporter 功能迭代

功能迭代主要包括表屬性感知、保證本地化率、支持輕量計算和安全隔離。其中表屬性感知就是感知特性，並保證特徵不會變，主要包括、混合存儲、新壓縮編碼、表級別副本數；保證本地化率是將Hfile寫入到分區所在服務器，保證本地化率和存儲特性，對一些rt敏感的業務效果明顯；支持輕量計算就是支持MD5，字符串拼接等函數；安全隔離是避免對外暴露HDFS地址、支持Task級別重試。函數

數據導出場景

菜鳥聯盟

菜鳥聯盟的場景如上圖所示。一個物流詳情會傳到HBase，HBase會傳到數據倉庫，數據倉會產生報表，而後去訓練路由算法。

淘寶客服

淘寶客服的一個退款應用場景如上圖。這是一個逆向連接，把退款、糾紛、退款物流、退款費用等實時的寫入到HBase裏，HBase會實時的寫入queue裏，blink流系統會消費queue產生一些數據會返回到HBase，blink輸出會支撐智能服務、客戶監控等。

增量數據導出須要解決的問題

增量數據導出須要解決的問題主要是離線數據的T+1處理特色、吞吐量、實時性、主備流量切換等。
早期的方案是會週期性的從HDFS裏把全部的日誌羅列出來，而後對日誌進行排序會產生一個有序的時間流。取work裏同步時間最短的做爲最終的同步時間。這種方案具備對NN節點形成很大壓力、沒法應對主備切換、日誌熱點處理能力低等問題。

HExporter系統

HExporter1.0如上圖所示，HExporter1.0優點主要有主備流量切換不影響數據導出，可以識別數據來源，過濾非原始數據；獨立的同步時間流，可以保障數據按有序時間分區Dump到數據倉庫；複用HBase replication框架，可以下降開發工做量，複用HBase的監控，運維體系。
HExporter1.0 優化主要包括如下五點：

減小拓撲網絡中的數據發送，備庫避免向Exporter發送重複數據；
遠程輔助消化器，空閒的機器幫助消化熱點；
避免發送小包，HExporter在接收到小包後，等待一段時間再處理；
同步通道配置隔離，實時消費鏈路和離線消費鏈路能夠採用不一樣的配置；
數據發送前壓縮。
HExporter1.0的問題是業務寫入流量產生高峯，離線出現同步延遲；HBase升級速度慢。而後咱們就有了如下解決思路，離線同步的資源能夠和在線資源隔離，利用離線大池子能夠削峯填谷；Exporter的worker是無狀態的，若是把全部邏輯都放在Exporter，那麼升級、擴容會簡單快速。而後就產生了HExporter2.0。

HExporter2.0如上圖所示