HBase學習系列

時間 2019-11-10

標籤 hbase 學習系列欄目 Hadoop 简体版

原文原文鏈接

轉自：http://www.aboutyun.com/thread-8391-1-1.htmlhtml

問題導讀：

1.hbase是什麼？

2.hbase原理是什麼？

3.hbase使用中會遇到什麼問題？

4.如何經過eclipse，操做hbase？

5.hbase常常和哪些軟件一塊兒使用？

。。。。。。。。。。

hbase從入門到編程

認識hbase

1.hbase簡介
hbase咱們或許已經知道了它是nosql，可是什麼是nosql，咱們不太清楚，nosql是一種基於列的數據庫，而咱們的傳統數據庫則是基於行的數據庫。想對nosql進一步瞭解，參考Nosql數據庫入門分享
HBase– Hadoop Database，是一個高可靠性、高性能、面向列、可伸縮的分佈式存儲系統，利用HBase技術可在廉價PC Server上搭建起大規模結構化存儲集羣。

<ignore_js_op>

HBase是GoogleBigtable的開源實現，相似Google Bigtable利用GFS做爲其文件存儲系統，HBase利用HadoopHDFS做爲其文件存儲系統；Google運行MapReduce來處理Bigtable中的海量數據，HBase一樣利用Hadoop MapReduce來處理HBase中的海量數據；Google Bigtable利用 Chubby做爲協同服務，HBase利用Zookeeper做爲對應。

更多內容參考：
Hbase簡介
http://www.aboutyun.com/thread-6138-1-1.html

2.hbase應用場景
咱們知道了hbase是什麼，那麼咱們何時使用。
當咱們對於數據結構字段不夠肯定或雜亂無章很難按一個概念去進行抽取的數據適合用使用什麼數據庫？答案是什麼，若是咱們使用的傳統數據庫，確定留有多餘的字段，10個不行，20個，可是這個嚴重影響了質量。而且若是面對大數據庫，pt級別的數據，這種浪費更是嚴重的，那麼咱們該使用是什麼數據庫？hbase數個不錯的選擇。更多內容參考：
hbase常識及habse適合什麼場景
http://www.aboutyun.com/thread-7073-1-1.html

3.hbase與傳統數據的區別
咱們總體瞭解了hbase，那麼hbase與傳統數據庫到底有哪些區別，咱們的增刪改查，nosql有沒有增刪改查，答案是有的。下面咱們以兩個圖來表示：
圖1，是咱們常常見到的傳統數據，圖2則是nosql數據庫，從這個圖中，或許咱們知道了，nosql爲何被稱之爲基於列的數據庫了。
想了解更多參考下面內容

圖解Nosql（hbase）與傳統數據庫的區別
http://www.aboutyun.com/thread-7804-1-1.html

hbase與傳統數據的區別
http://www.aboutyun.com/thread-6720-1-1.html

圖1傳統數據庫

圖2：hbase數據庫

4.hbase與hadoop的關係
咱們瞭解的越多，有時候問題就越多，hbase與hadoop是什麼關係，有了hadoop，咱們爲何使用hbase.這個有點像咱們的磁盤與數據庫，好比咱們的把mysql或則sqlserver放到D盤同樣。hadoop提供了介質，hbase存儲在hdfs上，同理hive也是如此，對於hive這裏不在詳述，能夠參考零基礎學習hadoop到上手工做線路指導（中級篇）。hbase與hive及hadoop的關係，更詳細參考下面帖子：

hive與hbase的十大區別與聯繫
http://www.aboutyun.com/thread-7870-1-1.html

5.hbase術語及原理

hbase中出現了Region，RegionServer，ROOT- 和.META表，
Region是HBase數據存儲和管理的基本單位。一個表中能夠包含一個或多個Region。每一個Region只能被一個RS（RegionServer）提供服務，RS能夠同時服務多個Region，來自不一樣RS上的Region組合成表格的總體邏輯視圖。

HBase中有兩張特殊的Table，-ROOT-和.META.
META.：記錄了用戶表的Region信息，.META.能夠有多個regoin
ROOT-：記錄了.META.表的Region信息，-ROOT-只有一個region
當咱們執行添加、刪除數據的時候，相應的hbase的META，ROOT都會有相應的改變。
更多內容參考：

HBase 各部件的做用

http://www.aboutyun.com/thread-5862-1-1.html

hbase中什麼是Region，什麼是RegionServer？
http://www.aboutyun.com/thread-7159-1-1.html

HBASE原理簡述
http://www.aboutyun.com/thread-7199-1-1.html

hbase部署

咱們掌握理論知識，並非真正的認識，由於計算機是一門實踐學科，下面咱們開始部署hbase，什麼是部署，這裏是安裝的意思，由於Linux的安裝軟件與window有所區別的，因此對於剛接觸Linux的同窗，在部署方面還須要花很多功夫的。

hbase的部署分爲單機部署及集羣部署，建議採用集羣部署，在部署hbase以前，須要安裝hadoop。部署文檔能夠參考：

hbase 0.96整合到hadoop2.2三個節點全分佈式安裝高可靠文檔
http://www.aboutyun.com/thread-7746-1-1.html

在部署的時候，須要注意hadoop版本與hbase的版本匹配。
更多內容，可參考下面：

HBASE分佈式安裝視頻下載分享http://www.aboutyun.com/thread-6612-1-1.html

Hbase單節點部署及其基礎使用
http://www.aboutyun.com/thread-7677-1-1.html

HBASE分佈式安裝視頻下載分享
http://www.aboutyun.com/thread-6612-1-1.html

hadoop、hbase、hive版本對應關係
http://www.aboutyun.com/thread-7295-1-1.html

hbase與zookeeper能夠說是不可分離的，所以hbase有自帶的zookeeper，若是不使用自帶zookeeper，能夠禁用zookeeper，使用外部zookeeper。

Hbase禁用自帶ZooKeeper，使用已經安裝的ZooKeeper
http://www.aboutyun.com/thread-7451-1-1.html

上面咱們完成基本的配置，在後面的使用過程當中，咱們對集羣的要求增高，因此咱們就會須要了解更多的配置項的做用，下面帖子能夠參考。
hbase配置項說明

HBase 默認配置說明（收藏版）
http://www.aboutyun.com/thread-7914-1-1.html

Hbase配置項粗解（1）
http://www.aboutyun.com/thread-8274-1-1.html

Hbase配置項粗解（2）
http://www.aboutyun.com/thread-8275-1-1.html

Hbase配置項粗解（3）
http://www.aboutyun.com/thread-8276-1-1.html

其餘：

hbase-0.94.10.tar.gz包下載
http://www.aboutyun.com/thread-6114-1-1.html

hadoop_HBase安裝，數據分析與建模，實戰案例剖析
http://www.aboutyun.com/thread-5146-1-1.html

Ganglia監控Hadoop及Hbase集羣性能(安裝配置)
http://www.aboutyun.com/thread-8129-1-1.html

更多的jar包、安裝包
hadoop家族、strom、spark、Linux、flume等jar包、安裝包彙總下載(持續更新)

hbase整合

hbase不是單獨存在的，hbase能夠與hive、Impala、Flume整合。咱們爲何要整合？好比咱們hbase、hive整合以後，當咱們將數據插入hbase以後，hive隨之同步，咱們無須操做hive，這就是整合的好處。對於flume整合，當flume整合蒐集到數據以後，會自動發送到hbase，這樣省去了咱們不少的功夫去編程。咱們只須要關心咱們的業務邏輯便可。

hive與hbase整合原理介紹
http://www.aboutyun.com/thread-7824-1-1.html
闡述：
1.Hive與hbase整合的原理？
2.Hive與hbase整合後的使用場景？
3.Hive與hbase整合後的使用方法？

hive爲何與hbase整合
http://www.aboutyun.com/thread-7317-1-1.html
闡述：
1.hive爲何與hbase整合？
2.hive整合hbase的優缺點是什麼？

hbase 0.96整合到hadoop2.2三個節點全分佈式安裝高可靠文檔（推薦）
http://www.aboutyun.com/thread-7746-1-1.html
此文檔詳細介紹了hbase 0.96整合到hadoop2.2整合的步驟及遇到的相關問題

Impala與HBase整合實踐
http://www.aboutyun.com/thread-7856-1-1.html

編譯和使用hive與HBase通訊包--hive-hbase-handler.jar及下載
http://www.aboutyun.com/thread-7817-1-1.html
闡述：

1.hive與hbase對應版本

2.hive-hbase-handler.jar在於hbase、hive中起的做用是什麼？

3.hive-hbase-handler.jar是否有版本之分，不一樣版本是否都能使用這個包來整合hbase與hive？

4.整合過程當中hive-hbase-handler.jar應該放在hive的哪一個文件夾中？

hbase0.96與hive0.12整合高可靠文檔及問題總結
http://www.aboutyun.com/thread-7881-1-1.html
闡述下面問題：
1.hive安裝是否須要安裝mysql？
2.hive是否分爲客戶端和服務器端？
3.hive的元數據庫有哪兩種？
4.hive與hbase整合的關鍵是什麼？
5.hive的安裝是否必須安裝hadoop?
6.hive與hbase整合須要作哪些準備工做？7.hive元數據庫啓動卡住表明的含義是什麼？

Flume-ng將數據插入hdfs與HBase-0.96.0
http://www.aboutyun.com/thread-7912-1-1.html
闡述下面問題：
1.如何配置分佈式flume
2.master與node之間該如何配置，有什麼異同？
3.啓動命令是什麼？
4.flume把數據插入hbase，該如何配置？

hive0.13調整hbase 0.96.2 hadoop2.2.0 問題總結
http://www.aboutyun.com/thread-7893-1-1.html
闡述下面問題：
1.hive.aux.jars.path參數的做用是什麼？
2.Job Submission failed with exception 'java.io.FileNotFoundException'這個問題該如何解決？

Flume-1.4.0和Hbase-0.96.0整合實踐
http://www.aboutyun.com/thread-7418-1-1.html
闡述下面問題：
1.須要修改那些文件？
2.如何測試整合成功？
3.兼容問題該如何解決？

Flume-0.9.4和Hbase-0.96整合實踐
http://www.aboutyun.com/thread-7417-1-1.html
闡述下面問題：
1.都須要修改那些文件？
2.爲何修改這些文件？
3.代碼有的地方須要改動，猜想緣由什麼？

hbase使用

上面講了不少，從理論到實踐安裝，咱們終於可使用了，咱們很想嘗試增刪改查究竟是什麼樣子的？
咱們能夠安裝下面格式，來操做：

名稱	命令表達式
建立表	create '表名稱', '列名稱1','列名稱2','列名稱N'
添加記錄	put '表名稱', '行名稱', '列名稱:', '值'
查看記錄	get '表名稱', '行名稱'
查看錶中的記錄總數	count '表名稱'
刪除記錄	delete '表名' ,'行名稱' , '列名稱'
刪除一張表	先要屏蔽該表，才能對該表進行刪除，第一步 disable '表名稱' 第二步 drop '表名稱'
查看全部記錄	scan "表名稱"
查看某個表某個列中全部數據	scan "表名稱" , ['列名稱:']
更新記錄	就是重寫一遍進行覆蓋

這裏舉個具體例子：
1.建立一個表
hbase(main):011:0>create 'member','member_id','address','info'
0 row(s) in 1.2210seconds

2.drop一個表
hbase(main):029:0>disable 'temp_table'
0 row(s) in 2.0590seconds

更詳細參考下面帖子：

HBase Shell經常使用命令
http://www.aboutyun.com/thread-6151-1-1.html

上面是基本的操做，使用的時間越長，咱們的需求就會越多，好比刪除數據會遇到region不釋放，咱們想備份數據、按期刪除數據，壓縮數據、查詢優化等更詳細內容查看下面帖子：

HBase如何實現多條件查詢
http://www.aboutyun.com/thread-6685-1-1.html

開啓hadoop和Hbase集羣的lzo壓縮功能
http://www.aboutyun.com/thread-8349-1-1.html
闡述問題：
1.如何啓動hadoop、hbase集羣的壓縮功能？
2.lzo的做用是什麼？
3.hadoop配置文件須要作哪些修改？

HBase實現記錄按期定量刪除
http://www.aboutyun.com/thread-8307-1-1.html
闡述問題：
一、如何按期刪除數據？
二、如何在數據超過閾值時刪除數據？

hbase數據刪除不釋放region解決辦法
http://www.aboutyun.com/thread-8306-1-1.html
闡述問題：
1.刪除hbase數據有幾種方法？
2.刪除數據，region不釋放，你認爲該如何解決？

HBase 利用Coprocessor實現聚合函數
http://www.aboutyun.com/thread-7840-1-1.html
闡述問題：
一、HBase默認不支持聚合函數，那咱們該用什麼來實現呢？
二、怎麼用編程的方式去實現呢？

大數據應用之HBase數據插入性能優化之多線程並行插入測試案例
http://www.aboutyun.com/thread-8011-1-1.html
闡述問題：

一、單線程下HBase的插入性能如何？
二、如何在多線程下了解HBase的性能？

hbase與hadoop2.X在CentOS6.4下源碼編譯
http://www.aboutyun.com/thread-7150-1-1.html
闡述問題：
hadoop2.2.0編譯須要注意什麼問題？
HBase部署的時候須要注意什麼問題？
HBase0.96.0編譯前須要使用什麼爲相應的版本生成pom文件？

hbase meta表修復方式總結
http://www.aboutyun.com/thread-7998-1-1.html
闡述問題：

1.hbase hbck -fixMeta的做用是什麼？
2.如何從新將hbase meta表分給regionserver？
3.出現region的hole該如何修復?

優化hbase的查詢優化-大幅提高讀寫速率
http://www.aboutyun.com/thread-7657-1-1.html
闡述問題：
1.本文經過什麼方法優化查詢效率的？
2.如何增大RPC數量？
3.如何調整hbase內存？

hadoop及hbase的超時設置
闡述問題：
http://www.aboutyun.com/thread-7552-1-1.html
1.hadoop超時，該如何設置超時時間？
2.hbase超時時間限制，該如何設置？

優化hbase的查詢提高讀寫速率優化案例及性能提高的幾種方法
http://www.aboutyun.com/thread-7468-1-1.html
闡述問題：

1.徹底發揮不出hbase的效率的緣由是什麼？
--------------------------------
2.使用bloomfilter和mapfile_index_interval如何提高性能？
3.如何設置hbase的內存？
4.如何增大RPC的數量？
擴展：
5.爲何HBase是基於列模式的存儲？

Hbase數據備份和恢復
http://www.aboutyun.com/thread-7296-1-1.html

hbase工具

所謂工具就是幫助咱們的，hbase工具，則是幫助咱們使用hbase，phoenix的做用是什麼？
phoenix的操做sql是經過jdbc發送到HBase的。phoenix的查詢語句會轉化爲hbase的scan操做和服務器端的過濾器。若是咱們手工使用HBase的api去寫這些代碼，也會獲得相同的運行結果和執行速度。可是，使用phoenix的效果卻會帶來更快的開發效率。
更多詳細內容，見下面帖子：

hbase的sql操做的框架-phoenix
http://www.aboutyun.com/thread-6688-1-1.html

hbase有哪些可視化工具,圖形界面管理工具
http://www.aboutyun.com/thread-6257-1-1.html

phoenix實戰（hadoop二、hbase0.96）
http://www.aboutyun.com/thread-8208-1-1.html

Phoenix介紹：實現向HBase發送標準SQL語句
http://www.aboutyun.com/thread-8153-1-1.html

hbase設計

hbase設計這個是一個比較大的話題，不少都是根據本身項目的具體狀況來設計，這裏只是簡單說一下設計中須要注意的問題
1.防止數據傾斜
2.性能提高
防止數據傾斜，rowkey的設計仍是比較關鍵的。
性能提高，在設計之初，將要查詢的字段組合到rowkey中，不然後期可能查詢是一個問題。更多詳細內容參考下面帖子。

Hbase初步入門-- 表該如何構造和設計
http://www.aboutyun.com/thread-7828-1-1.html

HBase設計
http://www.aboutyun.com/thread-5903-1-1.html

hbase之rowkey的設計討論
http://www.aboutyun.com/thread-8171-1-1.html

HBase的rowkey設計
http://www.aboutyun.com/thread-7119-1-1.html

hbase數據快速備份：HBase snapshot分析
http://www.aboutyun.com/thread-8038-1-1.html

修復hbase元數據.meta.表空洞的問題
http://www.aboutyun.com/thread-7894-1-1.html

hbase Balancer 源碼分析-負載均衡
http://www.aboutyun.com/thread-7643-1-1.html

HBase Bug 知多少
http://www.aboutyun.com/thread-7135-1-1.html

hbase編程

hbase分爲兩種是一種開發API，就是所謂的二次開發，一種是客戶端API，也就是咱們使用hbase來完成一些事情。對於hbase源碼獲取，咱們須要具有maven知識，同hadoop獲取源碼的方式是同樣的，具體能夠參考：從零教你如何獲取hadoop2.4源碼並使用eclipse關聯hadoop2.4源碼.

經過eclipse獲取源碼以後，咱們會看到一些maven語法錯誤，若是遇到execution錯誤，能夠參考下面帖子。
hbabise、hadoop經過eclipse m2e maven插件獲取源碼產生execution錯誤解決方案
http://www.aboutyun.com/thread-8353-1-1.html

咱們獲取源碼是爲了查看更好的使用hbase，hbase的基本操做，在shell中可以完成，咱們經過Java API eclipse環境一樣能完成。除了增刪改查、分頁以外，咱們還能夠開發插件。
首先hbase開發，咱們須要搭建開發環境：
hbase開發環境搭建及運行hbase小實例（HBase 0.98.3新api）

hbase編程：Eclipse遠程鏈接建立hbase表以及填充列與列數據
開發環境有了，後面的操做參考：
hbase-0.90.2中建立表、插入數據，更新數據，刪除數據實例
http://www.aboutyun.com/thread-7496-1-1.html

Java操做hbase編程
http://www.aboutyun.com/thread-7075-1-1.html

spark使用java讀取hbase數據作分佈式計算
http://www.aboutyun.com/thread-8242-1-1.html

hbase編程：經過Java api操做hbase
http://www.aboutyun.com/thread-7151-1-1.html

hbase HTable之Put、delete、get等源碼分析
http://www.aboutyun.com/thread-7644-1-1.html

Hbase Java編程實現增刪改查
http://www.aboutyun.com/thread-6901-1-1.html

總結Eclipse 遠程鏈接 HBase問題及解決方案大全
http://www.aboutyun.com/thread-5866-1-1.html

HBase中如何開發LoadBalance插件
http://www.aboutyun.com/thread-8350-1-1.html

Hbase與eclipse集成的第一個例子
http://www.aboutyun.com/thread-7837-1-1.html

hbase分頁應用場景及分頁思路與代碼實現
http://www.aboutyun.com/thread-7030-1-1.html

HBase MapReduce排序Secondary Sort
http://www.aboutyun.com/thread-7304-1-1.html

CDH4源碼搭建hbase開發環境
http://www.aboutyun.com/thread-7259-1-1.html

Thrift瞭解4：C#經過Thrift操做HBase實戰
http://www.aboutyun.com/thread-7142-1-1.html

hbase API

hadoop2.2.0幫助手冊下載API及HBase 0.98.1-hadoop2 API
http://www.aboutyun.com/thread-6113-1-1.html

HBase數據遷移（1）-使用HBase的API中的Put方法
http://www.aboutyun.com/thread-8336-1-1.html

hbase編程：Java API鏈接Hbase進行增刪改查講解實例
http://www.aboutyun.com/thread-8290-1-1.html

hbase問題

hbase使用和開發過程當中會遇到各類問題，好比插入數據愈來愈慢，master啓動以後又掛掉，hbase如何存儲圖片，線上regionserver平白無故下線，這裏整理了一下。

hive-hbase整合後查詢緩慢
http://www.aboutyun.com/thread-7935-1-1.html

hbase插入數據，爲何速度愈來愈慢
http://www.aboutyun.com/thread-6564-1-1.html

hbase排錯:be reached after 1 tries, giving up.
http://www.aboutyun.com/thread-6579-1-1.html

hbase master啓動了又掛了
http://www.aboutyun.com/thread-5882-1-1.html

hbase配置、運行錯誤總結
http://www.aboutyun.com/thread-8319-1-1.html

hbase刪除數據的問題
http://www.aboutyun.com/thread-8304-1-1.html

hbase和hive整合問題
http://www.aboutyun.com/thread-8227-1-1.html

HBase如何把圖片存進去呢？
http://www.aboutyun.com/thread-8219-1-1.html

hbase編寫自定義count功能的問題
http://www.aboutyun.com/thread-8191-1-1.html

請問hbase如何設置region大小啊
http://www.aboutyun.com/thread-7974-1-1.html

hbase regionserver下線
http://www.aboutyun.com/thread-8138-1-1.html

hbase僞分佈式是否是沒有regionserver啊
http://www.aboutyun.com/thread-8158-1-1.html

hbase的「-ROOT-」表所在的block丟失,該如何恢復
http://www.aboutyun.com/thread-7988-1-1.html
hbase插入數據，出現java.lang.OutOfMemoryError
http://www.aboutyun.com/thread-7896-1-1.html

hive0.13與hbase0.98.2經過向Hbase表中導數據出現的錯
http://www.aboutyun.com/thread-7892-1-1.html

hbase編程如何獲取動態列
http://www.aboutyun.com/thread-7763-1-1.html

獲取源碼遇到問題解決方案：
hbase、hadoop經過eclipse m2e maven插件獲取源碼產生execution錯誤解決方案
http://www.aboutyun.com/thread-8353-1-1.html

解決問題的根本
hbase日誌

Hadoop和Hbase重要日誌位置
http://www.aboutyun.com/thread-6106-1-1.html

hbase在大企業應用

咱們在使用hbase的過程當中，咱們所遇到的問題，走過的路，或許別人已經遇到而且解決，對於阿里、360、Facebook等大公司是走在咱們前面的，下面的一些經驗能夠借鑑。

hbase在360的應用及使用過程當中遇到的問題及解決方案
http://www.aboutyun.com/thread-8298-1-1.html闡述問題：
1.360爲何使用hbase?
2.調用Put接口寫入數據，寫入性能丌高效的緣由是什麼？該如何解決？
3.bulkImport的數據導入階段較慢緣由是什麼？
4.bulkImport後，compaction操做會產生大量IO緣由是什麼？該如何解決？

HBase在淘寶主搜索的Dump中的性能調優
http://www.aboutyun.com/thread-8285-1-1.html
闡述問題：

1.hbase在運用中，如何有效下降延時？

2.如何對Dump進行性能調優？

淘寶搜索分析系統Pora2的應用之HBase高併發讀寫性能優化
http://www.aboutyun.com/thread-8025-1-1.html
闡述問題：
一、如何理解淘寶的搜索分析系統Pora？
二、redis超時的緣由有哪些？

Facebook使用HBase構建實時信息系統：能每個月存儲1350億條信息
http://www.aboutyun.com/thread-7499-1-1.html
闡述問題：
1.Facebook爲何選擇hbase?
擴展：
2.hbase爲何被稱之爲面向列的數據庫？
3.hbase爲何能能承受如此多的數據？

淘寶之HBase MapReduce實例分析
http://www.aboutyun.com/thread-7072-1-1.html
闡述問題：
1.hbase MapReduce那麼它和hadoop的MapReduce有什麼異同？
2.hbase MapReduce基本模型是什麼？
3.對於InputFormat和OutputFormat兩者的做用是什麼？
4.HBase經過對哪些類的擴展（繼承）來方便MapReduce任務來讀寫HTable中的數據？
5.HBase中Mapper類繼承哪一個類？
6.HBase中Reducer類繼承哪一個類？
7.HBase在提交做業時設置inputFormat成什麼？outputFormat設置成什麼？
8.HBase中TableMapReduceUtil類的做用是什麼？

淘寶hbase業務實踐
http://www.aboutyun.com/thread-7031-1-1.html
闡述問題：
1.HTablePool與傳統數據塊鏈接池那個對應？
2.經過那個函數能夠釋放鏈接池？
3.habse在什麼狀況下會比較慢？
4.RowKey該如何設計？

HBase在內容推薦引擎系統中的一些問題
http://www.aboutyun.com/thread-7147-1-1.html
闡述問題：
1.隨機讀取性能成倍降低的緣由是什麼？
2.Snappy壓縮是爲解決hbase什麼問題？
3.原生HBase最大的問題之一就是數據隨機讀寫速度太慢，該如何解決這個問題？
4.一個服務器宕機，其服務器的數據，作如何處理？
5.HBase須要經過Compaction解決什麼問題？
6.Region Server假死或則退出，會形成什麼狀況？

淘寶爲何使用HBase及如何優化的
http://www.aboutyun.com/thread-6940-1-1.html
闡述問題：
1.大數據量，並且數據增量不可預測，採用什麼方案比較合適？
2.hbase有什麼優勢和缺陷？
3.hbase採用什麼模型保證數據不丟失？
4.hbase的Meta表損壞以及split方面的bug會形成什麼狀況？
5.什麼狀況下會關閉jobtracker？
6.淘寶爲了保障服務從結果上的可用，都採起了什麼措施？
7.hbase中split爲何存在風險？

HBase工程師線上工做經驗總結----HBase常見問題及分析
http://www.aboutyun.com/thread-6929-1-1.html
闡述問題：
1.HBase遇到問題，能夠從幾方面解決問題？
2.HBase個別請求爲何很慢？你認爲是什麼緣由？
3.客戶端讀寫請求爲何大量出錯？該從哪方面來分析？
4.大量服務端exception，通常緣由是什麼？
5.系統愈來愈慢的緣由是什麼？
6.Hbase數據寫進去，爲何會沒有了，可能的緣由是什麼？
7. regionserver發生abort,遇到最可能是什麼狀況？
8.從哪些方面能夠判斷HBase集羣是否健康？
9.爲了增強HBase的安全性，你會採起哪些措施？

HBase在搜狐內容推薦引擎系統中的應用
http://www.aboutyun.com/thread-7297-1-1.html

Facebook針對hbase的優化方案分析
http://www.aboutyun.com/thread-7180-1-1.html

附上API
開發者API
hbase api
http://hbase.apache.org/devapidocs/index.html
用戶api
HBase 0.99.0-SNAPSHOT API
http://hbase.apache.org/apidocs/index.html

相關篇章推薦：
零基礎學習hadoop到上手工做線路指導（初級篇）

零基礎學習hadoop到上手工做線路指導（中級篇）

零基礎學習hadoop到上手工做線路指導（編程篇）