Spark DataFrame寫入HBASE常用方式

Spark是目前最流行的分佈式計算框架,而HBase則是在HDFS之上的列式分佈式存儲引擎,基於Spark做離線或者實時計算,數據結果保存在HBase中是目前很流行的做法。例如用戶畫像、單品畫像、推薦系統等都可以用HBase作爲存儲媒介,供客戶端使用。 因此Spark如何向HBase中寫數據就成爲很重要的一個環節了。本文將會介紹三種寫入的方式。代碼在spark 2.2.0版本親測。 1. 基於HB
相關文章
相關標籤/搜索