八年磨一劍,從新定義HBase——HBase 2.0&阿里雲HBase解讀

摘要:2018年6月6日,阿里雲ApsaraDB for HBase2.0正式發佈!從2010年開始「試水」到2018年,擁有了3個PMC,6個Committer,擁有中國最多HBase Committer的公司之一的阿里巴巴是如何八年磨一劍,從新定義HBase的?本文中,阿里雲技術專家所在就爲你揭曉答案。

本文內容根據演講嘉賓PPT以及視頻整理而成。

本文分享的內容主要分爲如下三個部分:
1、八年磨一劍
2、從新定義HBase
3、生態和案例

首先,本文會爲你們分享HBase的前世此生以及HBase在阿里巴巴的發展過程,爲你們講解什麼叫作「八年磨一劍」。在這以後將爲你們介紹HBase使用的場景以及一些相關問題,但願可以幫助你們更好地理解HBase,幫助你們在將來更好地使用HBase。第二部分將分享對於HBase的從新定義,爲你們解讀最新的HBase 2.0版本的能力以及其最新的能力究竟是什麼。此外,由於HBase的生態是開源的,要將HBase用得好,用得方便,用得穩,這中間還欠缺不少企業級軟件的能力。而阿里雲在這個過程當中作了不少的工做,所以在這部分也將爲你們介紹阿里雲HBase的總體產品形態以及阿里云爲了幫助企業和用戶更好地使用HBase和享受到HBase的能力作了哪些事情。在第三部分將總體地介紹HBase的生態以及一些實際的客戶案例。由於當客戶選擇使用HBase就不單單意味着只使用了HBase,而是表明選擇了HBase背後整個大數據生態,所以能夠使用整個Hadoop生態的能力,並在這部分的最後將爲你們分享一些實際客戶的案例,幫助你們更好地使用和理解HBase。

1、八年磨一劍
1. HBase的前世此生
首先爲你們分享HBase的發展歷程。關係型數據庫的發展已經經歷了40多年的歷史了,而HBase以及大數據這套東西的歷史大概從2006年被認爲是大數據的發起時期到如今,也就是13年左右而已。那麼,爲何會出現HBase以及Hadoop總體生態鏈的這些內容呢?這是由於在大數據時代,傳統數據庫須要面對不少挑戰,出現了數據量增多、業務複雜度提高、非結構化數據和結構化數據並存等諸多問題。這些問題所帶來的最直接的就是成本挑戰,所以特別須要價格低廉的數據庫來解決問題。

2eec2f6418535c68f71db894b8bc5f1c613a1ff3

這也就是Google提出BigTable開源最佳實現的緣由。Google是全球最大的搜索引擎,當他們發現出現的存儲成本問題以後,經過內部研究就發出來關於BigTable的這篇論文,而大概在2006年的時候也就發起了HBase這個項目,而且在兩年以後其就成爲Hadoop的子項目,通過了十幾年的發展,目前演變到了2.0版本。HBase可以幫助咱們以低成本解決大數據量、高併發、低時延的問題,而且保證了低成本的存儲。

2. 阿里的HBase之旅
爲什麼叫作「八年磨一劍」呢?這其實與阿里巴巴對於HBase的研發歷程是緊密相關的。在2010年,HBase正式成爲了Apache的頂級項目,與此同時阿里巴巴內部的業務也達到了瓶頸期,所以在2010年阿里巴巴開始對於HBase進行預研,通過了持續8年的研發,在2017年的時候輸出到阿里雲上,並將HBase的能力提供給廣大的用戶。其實,在阿里集團內部已經有了超過12000臺的HBase服務器規模,而最大集羣也超過了2000臺,這在世界上都是首屈一指的,而且也通過了天貓「雙11」的歷練。數據庫

相關文章
相關標籤/搜索