Hadoop生態圈

Hadoop框架 主要服務介紹 軟件 解析 備註 HDFS 分佈式存儲數據,數據分散存儲 一個存儲文件在HDFS中被分成若干個小塊,每個小塊被存儲在不同的服務器上 MapReduce 第一代分佈式計算框架 — 分佈式計算(將任務 分佈在多個服務器上,服務器越多,計算越快) Map階段—多臺機器同時讀取文件內容,分別做統計。Reduce階段— 將Map結果作爲輸入,進行彙總,整理,輸出結果 Tez、
相關文章
相關標籤/搜索