Spark學習—PairRDD編程

 PairRDD:鍵值對RDD,其是Spark中轉化操作常用的數據類型。上一篇文件《》我們就使用了PairRDD。PairRDD是很多程序的構成要素,因爲他提供了並行操作或跨節點重新進行數據分組的操作接口。本文將結合Java示例講解PairRDD相關接口操作。 一. PairRDD創建 很多存儲鍵值對的數據格式會在讀取時直接返回其鍵值對數據組成的pair RDD,同時也可以調用map()函數來實現
相關文章
相關標籤/搜索