MapReduce實現簡單join(利用框架排序機制)

輸入數據 有以下兩個輸入文件a.txt和b.txt,目的是將其按照第一列進行join,輸入文件如下: 利用MR進行join 思路是利用框架的排序機制,先用一個MapReduce(此時不對reduce進行任何編碼)將兩個文件的數據以<key,flag,value>的形式輸出(flag=1表示來自a.txt,flag=2來自b.txt),具體分別對a.txt和b.txt執行map_a.py和map_b
相關文章
相關標籤/搜索