Spark系列五:鍵值對RDD

Spark系列四: 基本RDD----行動操作 鍵值對RDD通常用來進行聚合計算。 一般通過一些初試ETL(抽取、轉化、裝載)操作來將數據轉化爲鍵值對形式。 Spark爲包含鍵值對類型的RDD提供了一些專有的操作,這些RDD被稱爲pairRDD, 我們通常從一個RDD中提取某些字段(如代表事件時間、用戶ID 或者其他標識符的字段),並使用這些字段作爲pairRDD操作中的鍵。 pairRDD提供了
相關文章
相關標籤/搜索