kudu是什麼

Apache Kudu Overview

建議配合[Apache Kudo]審閱本文(http://kudu.apache.org/overview.html)


數據模式

Kudo是一個列式存儲的用於快速分析的NoSQL數據庫,提供了相似SQL的查詢語句,與RDBMS十分相似,有PRIMARY KEY ,基於主鍵查詢而不是HBase的RowKey
html


低延遲隨機存取

與其餘大數據數據庫不一樣,Kudu不單單是一個文件格式。行訪問達到毫秒級延遲,支持C++ JAVA, API PyThon API 擁有簡單好用的API
git


融會貫通入Hadoop生態系統

你能夠使用Java Client實時導入數據,同時也支持Spark(運算) impala(分析工具,比Hive快) MapReduce HDFS HBase 很容易從HDFS中獲取數據,佔用內存小於1G
github


Super-fast Columnar Storage

列式存儲有利於編碼和壓縮,數據比使用Parquet壓縮還省空間。這樣的高壓縮,下降了數據的IO,爲計算服務。使用如laze data這樣的技術,使得超高速成爲可能
數據庫


分佈式和容錯機制

Kudu經過把tables切分紅tablets,每一個表均可以配置切分的哈希,分區和組合
Kudu使用了Raft來複制給定的操做,保證了數據同時存儲在兩個節點上,所以不村子單點故障。
apache


爲下一代硬件設計

說的是他們深刻了解了下一代處理器架構等等,在IO和資源優化等等方面作了一下改進
架構

相關文章
相關標籤/搜索