數據湖(二)

數據湖的基本架構 數據湖可以認爲是新一代的大數據基礎設施。爲了更好的理解數據湖的基本架構,我們先來看看大數據基礎設施架構的演進過程。 1) 第一階段:以Hadoop爲代表的離線數據處理基礎設施。如下圖所示,Hadoop是以HDFS爲核心存儲,以MapReduce(簡稱MR)爲基本計算模型的批量數據處理基礎設施。圍繞HDFS和MR,產生了一系列的組件,不斷完善整個大數據平臺的數據處理能力,例如面向在
相關文章
相關標籤/搜索