Spark join種類(>3種)及join選擇依據

浪尖維新:bigdatatipcss hashjoinjava join是做爲業務開發繞不開的SQL話題,不管是傳統的數據庫join,仍是大數據裏的join。python 作過Spark/flink流處理的應該都用過一種流表和維表的join,維表對於Spark來講能夠是driver端獲取後廣播到每一個Executor,而後在executor端執行流表task的時候join,其實大多數是個hashm
相關文章
相關標籤/搜索