[Spark RDD轉換操做運算子]

Spark RDD轉換操做 RDD,即彈性分佈式數據集,全稱爲Resilient Distributed Dataset,是一個容錯的,並行的數據結構,可讓用戶顯式地 將數據存儲到磁盤和內存中,並能控制數據的分區。同時,RDD還提供了一組很是豐富的操做來操做這些數據,如:map,flatMap,filter等轉換操做,以及SaveAsTextFile,conutByKey等行動操做。 本博客中將詳
相關文章
相關標籤/搜索