Spark快速大數據分析系列之第四章鍵值對操做

動機 鍵值對形式的RDD提供了新的強大的操做接口 鍵值對形式的RDD具備一個重要特性:分區。一些狀況下能夠顯著提高性能 建立Pair RDD 讀取外部數據時:若是外部數據自己是鍵值對形式的,讀取回來的RDD也是鍵值對形式 個普通的 RDD 轉爲 pair RDD 時,能夠使用map()函數 val pairs = lines.map(x => (x.split(" ")(0), x)) //
相關文章
相關標籤/搜索