hadoop實現Join的幾種方法

1) reduce side join reduce side join是一種最簡單的join方式,其主要思想以下: 在map階段,map函數同時讀取兩個文件File1和File2,爲了區分兩種來源的key/value數據對,對每條數據打一個標籤 (tag), 好比:tag=0表示來自文件File1,tag=2表示來自文件File2。即:map階段的主要任務是對不一樣文件中的數據打標籤。 在red
相關文章
相關標籤/搜索