《Spark快速大數據分析》——讀書筆記(4)

第4章 鍵值對操做 鍵值對RDD一般用來進行聚合計算。咱們通常要先經過一些初試ETL(抽取、轉化、裝載)操做來將數據轉化爲鍵值對形式。 本章也會討論用來讓用戶控制鍵值對RDD在各節點上分佈狀況的高級特性:分區。css 4.1 動機 pair RDD(包含鍵值對類型的RDD)提供了並行操做各個鍵或跨節點從新進行數據分組的操做接口。java 4.2 建立Pair RDD 當須要把一個普通的RDD轉爲p
相關文章
相關標籤/搜索