大數據系列(8)Hadoop生態簡介

生態圈 HBase簡介 高可靠,高性能,面向列,可伸縮,實時讀寫的分佈式數據庫 利用HDFS作爲其文件存儲系統,支持MR程序讀取數據 存儲非結構化和半結構化數據 RowKey:數據唯一標識,按字典排序 Column Family:列族,多個列的集合,最多不要超過3個 **TimeStamp時間戳:**支持多版本數據同時存在 Spark 基於內存的大數據並行計算框架 Spark是MapReduce的
相關文章
相關標籤/搜索