Spark學習—PairRDD編程

 PairRDD:鍵值對RDD,其是Spark中轉化操做經常使用的數據類型。上一篇文件《》咱們就使用了PairRDD。PairRDD是不少程序的構成要素,由於他提供了並行操做或跨節點從新進行數據分組的操做接口。本文將結合Java示例講解PairRDD相關接口操做。 一. PairRDD建立 不少存儲鍵值對的數據格式會在讀取時直接返回其鍵值對數據組成的pair RDD,同時也能夠調用map()函數來
相關文章
相關標籤/搜索