鍵值對操做

鍵值對 RDD 一般用來進行聚合計算。咱們通常要先經過一些初始 ETL(抽取、轉化、裝載)操做來將數據轉化爲鍵值對形式。鍵值對 RDD 提供了一些新的操做接口(好比統計每一個產品的評論,將數據中鍵相同的分爲一組,將兩個不一樣的 RDD 進行分組合並等)。node 1. 動機 Spark 爲包含鍵值對類型的 RDD 提供了一些專有的操做。這些 RDD 被稱爲 pair RDD 。PairRDD 是不
相關文章
相關標籤/搜索