圖解MapReduce各種join的使用

  1、Reduce side join:在reduce端進行連接 2、半連接:在map端將數據過濾,降低數據量,在reduce端連接 3、Map side join:在map端進行join 4、二次排序 基本原理是將key和部分value拼接成一個組合key(實現WritableComparable接口或者調用setSortComparatorClass函數),這樣reduce獲取的結果便是先按
相關文章
相關標籤/搜索