Spark學習—— (5) RDD基礎編程(基於Python)

RDD是Spark中最基本的數據抽象。雖然Spark2.x中建議使用效率更高的DataSet代替RDD,但仍是有必要學習一下RDD的相關知識。html 本文第一部分簡單介紹RDD的一些基本概念,第二部分則介紹RDD的經常使用操做並給出例子。web 另外,本文介紹的操做不涉及到鍵值對RDD的操做,然而鍵值對RDD是許多操做所須要的常見數據類型,這部份內容會在下一篇筆記中補充。緩存 文章目錄 1. R
相關文章
相關標籤/搜索