大數據面試題_Spark

時間 2020-06-11

原文原文鏈接

文章目錄 hadoop和spark都是並行計算，那麼他們有什麼相同和區別簡單說一下hadoop和spark的shuffle過程 spark集羣運算的模式 RDD中reduceBykey與groupByKey哪一個性能好，爲何 cache後面能不能接其餘算子,它是否是action操做 ReduceByKey是action算子嘛數據本地性是在哪一個階段肯定的 RDD的彈性體如今什麼方面常規的容錯

>>阅读原文<<