HBase 原理

在建立數據的時候就指定了Row key,HBase根據Row key來建立索引,而且還根據Row key的字典順序分別進行了存儲。咱們如下圖爲例,能夠看到圖左側是表的Row key的字典順序,能夠看到根據不一樣的範圍把Row key分紅了五個部分,每一個部分是一個Region,因此能夠理解爲,一個Region保存了一個Row key範圍的數據。右側有三個HRegionServer。字典順序從0到2(包括0,不包括2)的數據都存儲在rs2(HRegionServer)這臺設備上,字典順序從2到4(包括2,不包括4)存儲在rs1(HRegionServer)這臺設備上,等等。這樣存儲的好處是什麼呢?咱們查詢數據的時候根據Row key的字典順序能夠快速定位到數據在哪一臺設備上,而後再根據Row key索引快速定位到要查詢的數據。HBase還有個很是大的優點是可擴展性很是強,之後若是這張表須要增長字段將會很是簡單,由於HBase是容許動態添加列的。還有就是咱們不須要用多麼昂貴的服務器,用普通的PC服務器就能夠,無非多用幾臺設備罷了,用普通的PC照樣存儲很是龐大的數據。服務器

參考: http://blog.csdn.net/u012453843/article/details/53013782.net

相關文章
相關標籤/搜索