Spark 按key聚合求平均值與佔比

1.求key的平均值 k,v結構的數據中,求每一個key對應的平均值,在spark中怎麼應該怎麼求? 例若有以下的數據:python ("a",10) ("b",4) ("a",10) ("b",20) 想求a,b對應的平均值。 直接上代碼web sc.parallelize(List(("a",10),("b",4),("a",10),("b",20))).mapValues(x => (x,
相關文章
相關標籤/搜索