HBase 是什麼

Apache HBase™ is the Hadoop database, a distributed, scalable, big data store.

HBase 是 Hadoop database 一個分佈式(文件在HDFS上)的可拓展(分區域存儲的)的大數據倉庫。用於存儲和檢索海量數據

Use Apache HBase™ when you need random隨機, realtime實時 read/write access存取 to your Big Data. This project's goal is the hosting of very large tables -- billions數十億 of rows X millions百萬 of columns -- atop clusters of commodity hardware商用機器. Apache HBase is an open-source, distributed, versioned多版本(數據能夠有多個版本的值), non-relational database modeled after Google's Bigtable: A Distributed Storage System for Structured Data by Chang et al. Just as Bigtable leverages the distributed data storage provided by the Google File System, Apache HBase provides Bigtable-like capabilities on top of Hadoop and HDFS.數據庫

與傳統 RDBMS 數據庫,HBase 対與海量數據查詢檢索速度有明顯速度上的優點

Table in HBase

  • Schema:TableName & Column Family Name
    意味着 HBase 每一行的列不必定相同,不佔據空間(RDBMS爲NULL也佔據空間)
  • Value 和 Name 都是使用 byte[] 數組存儲在 HDFS 中

HBase 是一個面向列的數據庫,數據按列存儲

一個數據單元 Cell 包括了:rowkey + columnfamily + [column] + timestamp : value

  • columnfamily(列簇):字段的類別 eg: basic 包括了(name,age,birthday...)
  • rowkey(行關鍵字):相似RDBMS中的主鍵,做爲行的惟一標識符,每一個 cell 都,快速查詢的關鍵有 eg:ID

Example


[](http://images2017.cnblogs.com/blog/1047249/201707/1047249-20170731172419911-340741011.pngapache

相關文章
相關標籤/搜索