SparkSQL DF.agg 執行過程解析

在上一篇文章前, 我一直沒看懂爲何下面的代碼就能獲得max或者avg或者min的值: malePPL.agg(Map("height" -> "max", "sex" -> "count")).show 數據是 身高 性別 這樣的一個組合大概有幾百萬個值 剛開始是使用reducebykey去作計算, 後來發現網上有agg裏面直接進行排序獲取值的作法, 特意看了一下爲何傳進去一個Map(column
相關文章
相關標籤/搜索