大數據面試題_Spark

文章目錄 hadoop和spark都是並行計算,那麼他們有什麼相同和區別 簡單說一下hadoop和spark的shuffle過程 spark集羣運算的模式 RDD中reduceBykey與groupByKey哪一個性能好,爲何 cache後面能不能接其餘算子,它是否是action操做 ReduceByKey是action算子嘛 數據本地性是在哪一個階段肯定的 RDD的彈性體如今什麼方面 常規的容錯
相關文章
相關標籤/搜索