mapreduce之mapjoin

mapjoin指的是在mapreduce的map階段先加載一個文件緩存到內存當中,這個文件多是從磁盤讀取的或網絡請求的均可以。java map(key,value,context)方法中讀取的數據key和value,這兩個數據和先前緩存到內存中的數據一塊兒作處理後再context.write()到reduce階段。web mapjoin至關於在map階段寫數據到reduce階段前對數據作了處理。a
相關文章
相關標籤/搜索