RDD 操作

RDD Operations:這些操作和Scala的操作幾乎一樣,就不細說了。 1.transformations:lazy的操作,不能立即計算結果。相反,Spark只記得應用於一些基本數據集(例如文件)的轉換。只有當一個動作action需要返回到驅動程序的結果時才計算這些轉換。這種設計使Spark能夠更高效地運行。     RDDA==>RDDB (A轉換到B,這是兩個不同的RDD) 且通過記錄
相關文章
相關標籤/搜索