大數據面試題——Spark面試題(二)

1、Spark有哪兩種算子?     Transformation(轉化)算子和Action(執行)算子。   2、Spark有哪些聚合類的算子,我們應該儘量避免什麼類型的算子?     在我們的開發過程中,能避免則儘可能避免使用reduceByKey、join、distinct、repartition等會進行shuffle的算子,儘量使用map類的非shuffle算子。這樣的話,沒有shuffl
相關文章
相關標籤/搜索