wordcount程序整體運行流程示意圖

  map階段: 將每一行文本數據變成<單詞,1>這樣的kv數據 reduce階段:將相同單詞的一組kv數據進行聚合:累加所有的v 注意點:mapreduce程序中, map階段的進、出數據, reduce階段的進、出數據, 類型都應該是實現了HADOOP序列化框架的類型,如: String對應Text Integer對應IntWritable Long對應LongWritable
相關文章
相關標籤/搜索