選擇阿里雲數據庫HBase版十大理由

根據Gartner的預計,全球非關係型數據庫(NoSQL)在2020~2022預計保持在30%左右高速增加,遠高於數據庫總體市場。html

阿里雲數據庫HBase版也是踏着技術發展的節奏,伴隨着NoSQL和大數據技術的興起和發展,從2010年開始研究和發展。時光荏苒,日月如梭,轉眼九年時間,在阿里雲上直接開放提供服務也有1年多時間,並在去年的12月份全新發布X-Pack,將單一的HBase演進到一個完整的數據處理平臺的能力。咱們注意到還有不少同窗和客戶不清楚HBase X-Pack是什麼,什麼場景下合適選擇HBase X-Pack。redis

首先咱們先來看下HBase X-Pack的定位:數據庫

  • HBase X-Pack是基於HBase及HBase生態構建的 低成本一站式數據處理平臺。
  • HBase X-Pack支持:HBase API(包括RestServerThriftServer)、關係Phoenix SQL、時序OpenTSDB、全文Solr、時空GeoMesa、圖HGraph、分析Spark on HBase,是阿里雲首個支持多模式的分佈式數據庫,且協議100%兼容開源協議。
  • HBase X-Pack實現數據從處理、存儲到分析全流程閉環,讓客戶用最低成本實現一站式數據處理。

接下來一塊兒來梳理一下阿里雲HBase X-Pack關鍵能力,一塊兒看看選擇阿里雲HBase X-Pack的十個理由。編程

理由一:一體化數據處理平臺,提供一站式能力

企業數字化轉型時代,業務愈來愈複雜,須要一個平臺能夠提供一站式處理能力。傳統大數據各個組件很是多,各個組件分層發展,給擴展性帶來很是大的便利,但同時也引入了很是高的技術門檻,雲HBase X-Pack經過集成Spark,Solr,HBase,時序,時空,圖等組件,打通各個組件之間的數據同步,經過數據工做臺提供統一一體化交互式的操做體驗,實現計算、存儲、分析、檢索、機器學習五位一體的一站式能力,極大的下降了使用門檻,輕鬆上手,同時提供全託管的服務,避免各類複雜的運維和技術坑。安全

雲HBase X-Pack詳細的能力能夠訪問雲HBase的幫助,裏面有各個能力詳細的介紹:服務器

理由二:深厚的技術積累

企業決策選擇雲服務,最核心的一個因素就是下降TCO,最看重的核心因素就是背後的技術力量,服務能力。
阿里雲HBase X-Pack通過9年的發展,積累強大的專家團隊,目前擁有國際認證7個committer,4個PMC,擁有國內獨一無二的技術實力。
咱們擁有集團超過萬臺的服務經驗,對各類異常場景,數據可靠性,可用性,性能,數據遷移各個方面有全套的服務和工具。併發

理由三:獨家企業版本,以及最新2.0版本

阿里雲HBase提供的版本是通過、千錘百煉的企業版本,在穩定性和性能上遠勝於開源的版本,而且全球首家提供最新2.0版本。關於阿里雲HBase發展歷程,能夠看這裏詳細介紹:https://yq.aliyun.com/articles/601531。阿里雲HBase和開源版本的關鍵區別,能夠查看:
https://help.aliyun.com/document_detail/49502.htmloracle

理由四:開發效率最高的數據庫

Gartner在2017年數據庫廠商推薦報告中就明確指出多模是發展趨勢阿里雲新發布X-Pack更是將多模推上新高度,KV的基礎上,同時支持時序、時空、圖、文檔等多種數據模型。
咱們知道,大數據時代,業務多樣性是大數據的本質之一,強制使用單一模型只會下降生產效率,HBase X-Pack提供KV、SQL、時序、時空、圖豐富的多模多模能力,幫助客戶能夠根據不一樣的業務選擇不一樣的數據處理模型,支持業務靈活選擇,從而實現最高效率的開發和生產。運維

理由五:作成本最低的數據庫

HBase誕生於Google的bigtable論文,自然是爲了存儲海量互聯網數據而誕生,低成本能力是其自然的屬性。雲HBase X-Pack在繼承HBase自身能力的同時,爲了給客戶節省成本作了不少努力。體如今內核,總體方案各個方面,主要有:機器學習

  • 雲HBase版本的內核是通過優化的,性能平均高出自建版本30%~300%:
    若是對性能有要求的場景,就能夠節省更少的CPU資源,獲取更大的效果,具體能夠參考https://yq.aliyun.com/articles/198654
  • 齊全的產品形態,知足各類業務場景,提供最高性價比:
    HBase X-Pack支持單節點,集羣版本,跨可用區/跨地域雙集羣版本,知足用戶從測試,生產環境,高可用各類使用環境,平衡能力和成本,提供高性價比的選擇,具體能夠參考https://help.aliyun.com/document_detail/71538.html
  • 提供數據全生命週期管理功能,數據冷熱分離,存儲成本降低3.5倍:
    不少場景裏面,數據有冷熱的需求,咱們提供不一樣的存儲介質,包括OSS,本地盤,雲盤,高性能雲盤,幫助客戶實現最佳的存儲成本,詳細的能夠看下https://yq.aliyun.com/articles/646983
  • 客戶基於ECS自建,存儲選擇雲盤,hdfs副本數自然是3副本:
    HBase服務經過和雲盤深度集成2副本就能夠一樣的性能和可靠性。在存儲上自然節省1/3,詳細的能夠訪問https://yq.aliyun.com/articles/646983
  • 全託管服務,提供代維,99.9%的SLA:
    運維在平常數據庫工做中佔了很大的比重,並且數據庫的穩定性關係到整個系統,牽一髮和動全身,雲HBase X-Pack提供全託管的服務,給客戶節省運維費用,以及極大的避免故障帶來的損失。
  • 提供一體化的方案節省成本:
    雲HBase X-Pack經過把各個組件深度集成和融合,經過組合各個產品之間的能力,給不少場景帶來增效,解決了性能瓶頸的同時,帶來成本的降低。這裏舉2個典型的例子:
  1. 不少人工智能,多媒體場景,在線教育裏面,大量圖片、小視頻文件。傳統的使用方法都是存在OSS裏面,OSS自然併發和時延處理能力有限,同時讀寫都是要收費的,讀寫次數越多,費用越高,使用HBase X-Pack沒有這部分的費用,能夠解決性能的瓶頸的同時,帶來綜合成本的下降。

  1. 碰到非結構化數據查詢的訴求時,你們通常會想起ES。ES適合文本查詢,入庫會比較差(通常就幾百條/S),查詢函數也有限。HBase X-Pack經過支持Solr徹底補齊了文本查詢的能力。同時Phoneix+solr組合結合了HBase和搜索的二者的優點,在吞吐和併發上有優點。對SQL的易用性也有優點。尤爲是在新零售等場景,一張表中混雜結構化字段和非結構化字段,能夠根據需求,自動建立索引,融合二者的優點。倒排膨脹率很高,入庫會極速降低。大部分客戶只是部分字段有模糊查詢的需求,ES強制全部的用單一技術。Phoneix很是適合併發高的查詢,條件很少。搜索技術補充了索引技術,適合各類條件。經過結合phoneix+solr成功平滑查詢和存儲性能,提升性能的同時,存儲成本也降低幾倍,很是適合結構化+非結構化混合的場景。

理由六:力爭作最好用的數據處理平臺

HBase主要提供在線查詢能力,沉澱下來的數據須要使用Spark來作複雜分析,HBase X-Pack中的Spark爲了讓用戶更便捷的作數據處理,產品上面提供瞭如下能力:

1)數據工做臺:支持交互式、做業管理、工做流、資源管理、元數據管理,從測試、開發、上線一站式開發體驗
2)spark內置connector:一鍵關聯hbase、mongo、redis、rds等集羣,免去調試的煩惱,更加便捷的分析其餘數據庫的數據
3)支持多語言:能夠選擇習慣的語言進行編程
4)可維護性:支持小版本升級、監控、報警,免去Spark集羣維護
5)離線數倉能力:一鍵歸檔在線庫rds、polardb、mongo、hbase、cassandra數據到Spark數倉
6)成本:集羣默認存儲爲集羣版本HDFS,同時支持數據存儲在oss降成本

使用HBase X-Pack Spark可以構建業界成熟的一體化數據處理平臺,支撐推薦、風控、離線數倉、實時處理及計算、大數據運營、日誌分析、去oracle複雜分析等業務場景:

理由七:數據可靠性做爲重中之重

對大多數公司來講數據的安全性以及可靠性是很是重要的,如何保障數據的安全以及數據的可靠是大多數數據庫必須考慮的。2016 IDC的報告表示數據的備份(data-protection)和數據恢復(retention)是NoSQL的最基礎的需求之一,阿里雲NoSQL數據庫也一直把怎麼保障客戶的數據安全放在首位。
以雲HBase爲例,傳統數據庫備份恢復的能力都是TB級別,在交易等場景下面是足夠的,但面向大數據場景就捉襟見肘了。雲HBase經過垂直整合高壓縮、內核級優化等能力,將備份恢復的量級成功推高百倍以上,作到 百TB級別甚至更高 ,讓客戶在大數據量場景下也無後顧之憂。
雲HBase支持全量(備份集)備份、全量(備份集)恢復、增量(實時)備份、增量(時間點)恢復完整備份恢復能力。

理由八:單集羣3個9高可用,雙集羣4個9高可用

HBase經過內核加固,一系列自動運維修復工具,單集羣能夠提供3個9的可用性,爲了知足不少場景下面更高可用性的要求,雲HBase支持跨可用區或者跨地域雙集羣主備同步,可讓多個HBase集羣保持同步關係。在一個集羣出現故障的時候,迅速地將業務切換至另一個集羣從而避免故障。HBase主備之間數據的同步基於異步鏈路實現,遵循最終一致性協議,典型的主備同步延遲在200ms左右。

理由九:大量場景驗證,久經考驗

阿里雲HBase從10年上線以來,在阿里集團內部久經考驗,超過12000臺服務器,單集羣超過2000臺的規模應用。
雲HBase自發布以來,經過豐富的能力,優秀的全託管能力,全面超越同類產品的技術能力獲得金融、社交、多媒體、新零售、車聯網網、製做業、政企等等多個行業,多上千個客戶的信賴,積累了大量的使用經驗。歡迎咱們的新老客戶訪問首頁獲取更多的信息:

理由十:提供不停機遷移服務,讓自建遷移無憂

客戶已經使用ECS自建服務,想使用雲HBase服務,最擔憂的應該仍是遷移過程當中對業務的影響,技術團隊充分考慮這一點,提供免費的不停機遷移服務,對在線業務0影響,數據遷移一行不丟。當前業界有能力提供不提供不停機遷移HBase服務的僅此一家。

本文簡單梳理了阿里雲HBase X-Pack十大理由,但願能對你們理解雲HBase有一個幫助,另外也給您選型作一個充分的參考。當能咱們還有不少改進的空間,咱們還在成長的路上持續努力,也歡迎你們聯繫咱們提出寶貴的意見,最後福利,歡迎使用雲HBase X-Pack版本,針對首次購買的用戶推出了雲數據庫HBase單節點獨享規格,歡迎你們申請試用:https://promotion.aliyun.com/ntms/act/hbasefree.html



本文做者:所在jason

閱讀原文

本文爲雲棲社區原創內容,未經容許不得轉載。

相關文章
相關標籤/搜索