hadoop 之MR的join操作

在SQL語句中,我相信大家都使用Join操作,但是今天我來談談MapReduce中的join操作是如何進行的。 先來看一下在join的效果 如果對MR熟悉的同學,應該清楚map在把數據處理完之後是會經過shuffle過程的。數據真正到達reduce的是已經被分好類的。那麼什麼是分好類的呢? 就想上面的表所示,如果我們把基本信息和額外信息作爲map輸入的內容,那麼我們可以得到如下的數據: 1 張三
相關文章
相關標籤/搜索