RDD的鍵值對操做(pair RDD)

RDD的鍵值對操做 建立 能夠從RDD中直接經過map函數進行建立web lines = sc.textFile("file:///usr/local/spark/README.md") pairs = lines.map( lambda x : (x.split(" ")[0], x) ) # 將第一行的第一個單詞做爲key,該行字符串做爲value,構建pairRDD print( pairs
相關文章
相關標籤/搜索