四:RDD之--Pair RDD

RDD之--Pair RDD 1. Pair RDD介紹 (1)Pair RDD是以Key-Value形式存在的數據。對於現實生活中的一些數據需要以鍵值對的形式存在(比如統計每個產品的評論,將數據中鍵相同的分爲一組)。 (2)spark爲包含鍵值對類型的RDD提供了一些專有的操作(這樣的RDD稱爲:Pair RDD)。另外,Pair RDD提供了並行操作對各個鍵或跨節點重新進行數據分組的操作接口。
相關文章
相關標籤/搜索