Spark中的三種Join策略

介紹 Spark通常使用三種Join策略方式 Broadcast Hash Join(BHJ) Shuffle Hash Join(SHJ) Sort Merge Join(SMJ) Broadcast Hash Join 當小表與大表進行Join操作時,爲了避免shuffle操作,將小表的所有數據分發到每個節點與大表進行Join操作,儘管犧牲了空間,但是避免了耗時的Shuffle操作。 表需要b
相關文章
相關標籤/搜索