Spark與HBase的整合

前言 以前由於僅僅是把HBase當成一個可橫向擴展而且具備持久化能力的KV數據庫,因此只用在了指標存儲上,參看很早以前的一篇文章基於HBase作Storm 實時計算指標存儲。此次將HBase用在了用戶行爲存儲上,由於Rowkey的過濾功能也很不錯,能夠很方便的把按人或者內容的維度過濾出全部的行爲。從某種意義上,HBase的是一個有且僅有一個多字段複合索引的存儲引擎。git 雖然我比較推崇實時計算,
相關文章
相關標籤/搜索