精通spark源碼-rdd是如何運行的

一、spark執行過程的一個例子 // rdd_people: id,年齡 var rdd_people = sc.range(1, 100, 1).map(i=>(i, 20+i%80) ) //rdd_score: id,成績 var rdd_score =sc.range(1, 100, 1).map(i=>(i ,i+2)) //兩個進行join var rdd_res = rdd_pe
相關文章
相關標籤/搜索