MapJoin和ReduceJoin區別及優化

MapJoin和ReduceJoin區別及優化 1 Map-side Join(Broadcast join) 思想:web 小表複製到各個節點上,並加載到內存中;大表分片,與小表完成鏈接操做。apache 兩份數據中,若是有一份數據比較小,小數據所有加載到內存,按關鍵字創建索引。大數據文件做爲map的輸入,對map()函數每一對輸入,都可以方便的和已加載到內存的小數據進行鏈接。把鏈接結果按key
相關文章
相關標籤/搜索