本週學習了教材中的第四章:分佈式數據庫Hbase數據庫
經過學習本章內容學習到HBase跟傳統關係數據庫有很大的區別,服務器
(1)數據類型:關係數據庫都是運用了關係模型,主體-屬性的方法來找出對應關係來進行存儲,而HBase採用了很簡單的數據模型,他將數據存儲爲未解釋的字符串。分佈式
(2)數據操做:關係數據庫有不少操做,錶鏈接等,HBase不存在這些複雜的操做,只有增刪改查。函數
(3)存儲模式:關係數據庫是經過行來進行操做,例如增長完整的一行,刪除完整的一行。而HBase是經過列來進行操做,同時存儲的時候HBase也是經過列來進行存儲的學習
(4)數據索引:傳統關係數據庫是二維表,而HBase是四維表,關係數據庫經過一個2個關鍵值便能索引到數據,而HBase只有一個索引---行鍵。索引
(5)數據維護:關係數據庫中,更新操縱新數據會覆蓋就數據,而在HBase中會保留舊數據。字符串
(6)可伸縮性:關係數據庫由於是進行行操做,一旦表建好了,增長屬性就很難進行操做,而HBase是經過列操做,增長一列來進行橫向擴展就變得更容易。io
HBase的四個維度:行鍵、列族、列名、時間戳。ast
三個主要功能組件:1.庫函數:提供客戶端和HBase的端口鏈接訪問,2.Master主服務器:負責管理和維護HBase表的分區信息,3.Region服務器:負責存儲和維護分配給本身的Region,處理來自客戶端的讀寫請求。原理
三層尋址原理:既能知足大量數據的地址的存儲還能知足準確的定位。客戶端先訪問ROOT表找到存放Region的META表,經過META表來找到存放region的region地址。