mapreduce簡單編寫

一. MapReduce 編程模型 還是以一個經典的圖片來說明問題. 1. 首先, 我們能確定我們有一份輸入, 而且他的數據量會很大 2. 通過split之後, 他變成了若干的分片, 每個分片交給一個Map處理 3. map處理完後, tasktracker會把數據進行復制和排序, 然後通過輸出的key 和value進行 partition的劃分, 並把partition相同的map輸出, 合併爲
相關文章
相關標籤/搜索