MapReduce 詳解

MapReduce的整個運行分爲兩個階段: Map和Reduce Map階段由一定數量的Map Task組成 輸入格式的數據格式化:InputFormat 數日數據的處理:Mapper 數據分組:Partitioner 下面流程圖: 1. Map task 首先從HDFS上Read文件,通過Input Format把分件切分成一個一個的split.生成<Key,Value> key默認用行在文件中
相關文章
相關標籤/搜索