kudu是什麼

時間 2019-12-11

標籤 kudu 什麼简体版

原文原文鏈接

Apache Kudu Overview

Kudo是一個列式存儲的用於快速分析的NoSQL數據庫，提供了相似SQL的查詢語句，與RDBMS十分相似，有PRIMARY KEY ，基於主鍵查詢而不是HBase的RowKey
html

與其餘大數據數據庫不一樣，Kudu不單單是一個文件格式。行訪問達到毫秒級延遲，支持C++ JAVA, API PyThon API 擁有簡單好用的API
git

你能夠使用Java Client實時導入數據，同時也支持Spark(運算) impala(分析工具，比Hive快) MapReduce HDFS HBase 很容易從HDFS中獲取數據，佔用內存小於1G
github

列式存儲有利於編碼和壓縮，數據比使用Parquet壓縮還省空間。這樣的高壓縮，下降了數據的IO，爲計算服務。使用如laze data這樣的技術，使得超高速成爲可能
數據庫

Kudu經過把tables切分紅tablets,每一個表均可以配置切分的哈希，分區和組合
Kudu使用了Raft來複制給定的操做，保證了數據同時存儲在兩個節點上，所以不村子單點故障。
apache

說的是他們深刻了解了下一代處理器架構等等，在IO和資源優化等等方面作了一下改進
架構

相關標籤/搜索