sparksql的三種join實現

sparksql的三種join實現 引言 Join是SQL語句中的常用操作,良好的表結構能夠將數據分散在不同的表中,使其符合某種範式,減少表冗餘、更新容錯等。而建立表和表之間關係的最佳方式就是Join操作。 對於Spark來說有3中Join的實現,每種Join對應着不同的應用場景: Broadcast Hash Join : 適合一張較小的表和一張大表進行join Shuffle Hash Joi
相關文章
相關標籤/搜索