Spark鍵值對操作(python實驗版)

說明:此處介紹的是pair RDD特有的操作,前面介紹的基礎RDD操作,也適用pair RDD。 一、創建pair RDD 1、將普通RDD轉換成pair RDD時,使用map()實現。 pairs = lines.map(lambda x: (x.split(" ")[0], x))  #在Python中使用第一個單詞作爲鍵創建出一個pair RDD,如圖: 二、Pair RDD的轉化操作 (以
相關文章
相關標籤/搜索