大數據筆記之MapReduce原理

MapReduce原理 Mapreduce是一種「分而治之」的思想,把大任務拆解爲多個小任務 原理流程 框架解剖圖 輸入數據分塊InputSplits:InputSplit定義了輸入到單個Map任務的輸入數據,一個MapReduce程序被統 稱爲一個Job,可能有上百個任務構成。InputSplit將文件分爲64MB。 RR(RecordReader):稱數據記錄讀入,其作用定義瞭如何將輸入的數據
相關文章
相關標籤/搜索