再談全局網HBase八大應用場景

摘要: HBase能夠說是一個數據庫,也能夠說是一個存儲。擁有雙重屬性的HBase天生就具有廣闊的應用場景。在2.0中,引入了OffHeap下降了延遲,能夠知足在線的需求。引入MOB,能夠存儲10M左右的對象,徹底適應了對象存儲。另外因爲自身的併發能力、存儲能力,能夠說是具備最爲競爭力的引擎數據庫

HBase概述

HBase是一個分佈式存儲、數據庫引擎,能夠支持千萬的QPS、PB級別的存儲,這些都已經在生產環境驗證,而且在廣大的公司已經驗證。特別是阿里、小米、京東、滴滴內部都有數千、上萬臺的HBase集羣。選擇一個技術的首要條件是對齊大公司,大公司會投入大量的人力去維護、改進、貢獻社區。架構

關於NewSQL與NoSQL的關係

技術老是不斷向前發展的,現在都在提NewSQL,其實NewSQL在筆者看來是NoSQL之上的一個封裝,一個子場景。NoSQL中的大表,典型就是提供了KV1V2……Vn,其中每一個V能夠是1b,也能夠是100MB。能夠說是一個元的存在,就相似於數字世界的01,能夠任意組合。在以HBase爲表明的NoSQL中,HBase能夠組合出任意的場景,NewSQL能夠是之上加了SQL層或者更近一層添加事務的子場景。併發

關於計算與存儲分離

在雲上,對於引擎最爲核心的就是存儲計算分離,存儲能夠按需計費,起碼得彈性伸縮。計算則按節點存儲提供,徹底按照QPS計費,要麼費用高得嚇人,要麼難以知足更多的場景。好比存儲10M,到底算一次QPS,仍是多少次。 因爲HBase天生就是存儲計算分離,自然比較適配雲上的架構,能夠說到了雲上,HBase更加具備優點。分佈式

HBase場景

HBase能夠說是一個數據庫,也能夠說是一個存儲。擁有雙重屬性的HBase天生就具有廣闊的應用場景。在2.0中,引入了OffHeap下降了延遲,能夠知足在線的需求。引入MOB,能夠存儲10M左右的對象,徹底適應了對象存儲。另外因爲自身的併發能力、存儲能力,能夠說是具備最爲競爭力的引擎工具

clipboard.png

  • 對象存儲:咱們知道很多的頭條類、新聞類的的新聞、網頁、圖片存儲在HBase之中,一些病毒公司的病毒庫也是存儲在HBase之中
  • 時序數據:HBase之上有OpenTSDB模塊,能夠知足時序類場景的需求
  • 推薦畫像:特別是用戶的畫像,是一個比較大的稀疏矩陣,螞蟻的風控就是構建在HBase之上
  • 時空數據:主要是軌跡、氣象網格之類,滴滴打車的軌跡數據主要存在HBase之中,另外在技術全部大一點的數據量的車聯網企業,數據都是存在HBase之中
  • CubeDB OLAP:Kylin一個cube分析工具,底層的數據就是存儲在HBase之中,很多客戶本身基於離線計算構建cube存儲在hbase之中,知足在線報表查詢的需求
  • 消息/訂單:在電信領域、銀行領域,很多的訂單查詢底層的存儲,另外很多通訊、消息同步的應用構建在HBase之上
  • Feeds流:典型的應用就是xx朋友圈相似的應用
  • NewSQL:之上有Phoenix的插件,能夠知足二級索引、SQL的需求,對接傳統數據須要SQL非事務的需求 更多的場景須要不斷挖掘

以上,再次回顧,HBase的場景,作了一個簡單的分類,後續會有一些針對一些場景的實際的案例spa

閱讀原文插件

相關文章
相關標籤/搜索