Spark RDD上的map operators是如何pipeline起來的

本文原文(點擊下面 閱讀原文 即可進入):https://www.jianshu.com/p/45c9ee55eea6 最近在工作討論中,同事提出了這麼一個問題:作用在一個RDD/DataFrame上的連續的多個map是在對數據的一次循環遍歷中完成的還是需要多次循環? 當時我很自然地回答說:不需要多次循環,spark會將多個map操作pipeline起來apply到rdd partition的每個
相關文章
相關標籤/搜索