Kudo是一個列式存儲的用於快速分析的NoSQL數據庫,提供了相似SQL的查詢語句,與RDBMS十分相似,有PRIMARY KEY ,基於主鍵查詢而不是HBase的RowKey
html
與其餘大數據數據庫不一樣,Kudu不單單是一個文件格式。行訪問達到毫秒級延遲,支持C++ JAVA, API PyThon API 擁有簡單好用的API
git
你能夠使用Java Client實時導入數據,同時也支持Spark(運算) impala(分析工具,比Hive快) MapReduce HDFS HBase 很容易從HDFS中獲取數據,佔用內存小於1G
github
列式存儲有利於編碼和壓縮,數據比使用Parquet壓縮還省空間。這樣的高壓縮,下降了數據的IO,爲計算服務。使用如laze data這樣的技術,使得超高速成爲可能
數據庫
Kudu經過把tables切分紅tablets,每一個表均可以配置切分的哈希,分區和組合
Kudu使用了Raft來複制給定的操做,保證了數據同時存儲在兩個節點上,所以不村子單點故障。
apache
說的是他們深刻了解了下一代處理器架構等等,在IO和資源優化等等方面作了一下改進
架構