Shuffle 中六大使人費解的問題

第一大問題:何時進行 Shuffle 的 fetch 操做?Shuffle 是在一邊進行 Mapper 端 map 操做的同時,一邊進行 Reducer 端的 shuffle 和 reduce 操做嗎? 錯誤的觀點是:Spark 是一邊 Mapper 一邊 Shuffle 的,而 Hadoop MapReduce 是先完成 Mapper 而後才進行 Reducer 的 Shuffle。正確的觀點是
相關文章
相關標籤/搜索