二十8、map join實操

1、map join 使用場景 1.使用場景 Map Join適用於一張表十分小、一張表很大的場景。java 2.優勢 思考:在Reduce端處理過多的表,很是容易產生數據傾斜。怎麼辦? 在Map端緩存多張表,提早處理業務邏輯,這樣增長Map端業務,減小Reduce端數據的壓力,儘量的減小數據傾斜。web 3.具體辦法:採用DistributedCache (1)在Mapper的setup階段,將
相關文章
相關標籤/搜索