Hadoop之MapReduce的Join解析

代碼存於github:https://github.com/zuodaoyong/Hadoop 1、Reduce Join(會出現數據傾斜) 通過將關聯條件作爲Map輸出的key,將兩表滿足Join條件的數據並攜帶數據所來源的文件信息,發往同一個ReduceTask,在Reduce中進行數據的串聯 需求:將商品信息表中數據根據商品pid合併到訂單數據表中 訂單數據: Id pid amount 1
相關文章
相關標籤/搜索