spark的RDD中的action(執行)和transformation(轉換)兩種操做中常見函數介紹

spark的RDD中的action(執行)和transformation(轉換)兩種操做中常使用的函數html (1) 彈性分佈式數據集(RDD)         Spark是以RDD概念爲中心運行的。RDD是一個容錯的、能夠被並行操做的元素集合。建立一個RDD有兩個方法:在你的驅動程序中並行化一個已經存在的集合;從外部存儲系統中引用一個數據集。RDD的一大特性是分佈式存儲,分佈式存儲在最大的好處
相關文章
相關標籤/搜索